(Comments)

Machine Learning

Machine Learning memiliki etika tersendiri 

Berikut hasil dari interview di Medium

Leo Polovets dari Susa Ventures baru-baru ini duduk dengan Machine Learning untuk mengobrol tentang pembelajaran mesin, parit data, dan etika kecerdasan buatan.

Sam: Leo! Senang bertemu denganmu.

Bisakah Anda memperkenalkan diri dan konteks untuk pekerjaan yang telah Anda lakukan yang mungkin tidak disadari oleh audiens kami?

Leo: Senang bertemu denganmu juga, Sam. Tentu.

Saya 1 dari 3 mitra dengan dana benih $ 50 juta yang disebut Susa Ventures. Saya telah berinvestasi di perusahaan seperti  ,  , dan  . Sebelum dana awal, saya telah menjadi insinyur perangkat lunak selama satu dekade - termasuk di LinkedIn saat mereka 13 karyawan.

Setelah itu saya pergi ke Google di mana saya mendapatkan paparan pertama saya untuk Big Data dan pembelajaran mesin tentang deteksi penipuan.

Tim saya bertanggung jawab untuk memproses transaksi checkout yang masuk dan memperkirakan penipuan secara real time untuk produk yang disebut Google Checkout. Itu ditutup beberapa tahun yang lalu, dan dimasukkan ke Google Wallet.

Setelah itu saya menemukan diri saya kehilangan kehidupan startup, jadi saya pergi ke lokasi startup data yang disebut  mana saya berkecimpung sebagian besar dalam pemrosesan data, pembersihan, dan de-duping.

Saya belum melakukan pembelajaran mesin coding secara langsung, tetapi saya telah terlibat dalam sejumlah proyek di mana ia dimanfaatkan.

Sam: Luar biasa. Anda telah menulis tentang  dan pentingnya membangun kumpulan data yang besar dan unik. Salah satu topik yang paling kami nikmati dalam Pembelajaran Mesin adalah  .

Menurut Anda,  apa yang paling menarik yang sedang dibangun saat ini?

Leo: Parit yang paling menarik sedang dibangun oleh produk SaaS vertikal di industri yang hanya sedikit disentuh oleh Tech-tools untuk pengacara, logistik, pengiriman, dan hal-hal seperti itu.

Produknya sangat menarik karena perangkat lunak belum sepenuhnya meresapi industri ini. Startup yang mengganggu industri ini biasanya akan mulai dengan produk minimum yang layak yang tidak memerlukan pembelajaran mesin sama sekali.

Produk ini akan lebih merupakan alat alur kerja yang membantu pengguna akhir melakukan sesuatu dengan aplikasi atau tablet yang secara historis mereka lakukan dengan pena dan kertas. Orang akan menggunakan produk baru benar-benar hanya untuk menambah kecepatan dan kenyamanan. Di latar belakang, perusahaan sedang membangun sebuah dataset yang belum pernah ada dalam bentuk digital, dan dapat mulai belajar mesin layering di atas dataset tersebut seiring waktu.

Contohnya adalah perusahaan bernama  . Mereka membuat sistem catatan untuk departemen hukum perusahaan, yang banyak bekerja dengan pengacara eksternal.

Bagian dari pekerjaan departemen hukum adalah manajemen dan persetujuan penagihan, serta penganggaran - pada dasarnya mencari tahu ke mana perginya uang itu. Hingga kini, pekerjaan itu mengharuskan pengacara mengirim dokumen setebal 120 halaman bolak-balik, dan itu benar-benar neraka.

SimpleLegal membawa proses itu online, dan menerima dokumen dengan cara yang lebih terstruktur. Untuk departemen hukum, struktur ini diterjemahkan menjadi lebih sedikit sakit kepala dan menghabiskan uang.

Untuk SimpleLegal, data terstruktur membantu mereka membangun pemahaman tentang berapa banyak biaya tugas di perusahaan, bagaimana perusahaan berbeda tagihan, dan untuk mengotomatisasi audit untuk pelanggan mereka.

Mereka dapat mengidentifikasi jika firma hukum tertentu terus menagih untuk hal-hal yang tidak seharusnya, firma mana yang memiliki hasil terbaik, dan akhirnya data dapat digunakan untuk membantu perusahaan membuat keputusan hukum yang lebih baik. Dengan tarif tagihan untuk mitra secara teratur melebihi $ 1000 / jam, masalah penagihan dapat benar-benar bertambah. Di sinilah penerapan pembelajaran mesin menjadi proposisi yang sangat menarik - dan berharga -.

Sam: Menarik. Anda sebutkan sebelumnya bahwa industri perkapalan adalah industri Pena dan Kertas lain yang siap untuk gangguan?

Leo: Tentu saja. Saya berinvestasi dalam ruang logistik melalui Flexport, yang memodernisasi pengiriman barang.

Mereka membantu perusahaan memindahkan barang secara internasional. Pengiriman kontainer barang melibatkan banyak langkah, termasuk truk di kedua sisi lautan, kapal di tengah, bentuk bea cukai, asuransi, dan sebagainya. Semua barang bergerak yang terlibat dalam proses membuatnya sangat menyakitkan untuk mengetahui biaya terkait dan memiliki jadwal pengiriman yang dapat diprediksi.

Perusahaan ekspedisi membantu mengoordinasikan semua langkah ini, tetapi secara tradisional bekerja menggunakan kombinasi pesan suara, email, dan faks. Flexport membuat proses ini online, dan mereka mengumpulkan data yang cukup untuk memberikan penawaran harga waktu-nyata, membantu mengoptimalkan penyedia pengiriman, dan memberikan pengalaman pelanggan yang jauh lebih baik, mengunci pesaing dari luar angkasa.

Sam: Oke, mari kita pindah persneling. Ada manfaat nyata untuk menjadikan proses dan kumpulan data ini online - tetapi saya ragu ini akan selalu bermanfaat.

Misalnya, awal tahun ini Komisi Penasihat Presiden tentang integritas Pemilu mengirimkan permintaan untuk data daftar pemilih (nama, alamat, dob, partai politik, sejarah pemilih, SSN) dari negara-negara untuk “menganalisis sepenuhnya kerentanan dan masalah yang berkaitan dengan pendaftaran pemilih dan voting. ”Orang tidak perlu berpikir terlalu keras untuk membayangkan bagaimana data ini dapat disalahgunakan untuk menekan voting dari populasi tertentu.

Sekarang setelah pembelajaran mesin memungkinkan kita untuk memproses dan menggambar koneksi antara set data yang semakin besar, bagaimana seharusnya pengembang memutuskan mana yang etis untuk dikerjakan?

Leo: Sejujurnya saya tidak punya jawaban yang bagus untuk ini.

Setiap orang memiliki kode etik mereka sendiri, dan setiap orang harus membuat panggilan pribadi apakah mereka baik-baik saja dengan dampak potensial dari algoritma yang mereka bangun.

Teknologi seperti ilmu dalam banyak hal. Ini memiliki potensi untuk kebaikan. Itu memiliki potensi untuk kejahatan.

Anda dapat menggunakan Google untuk mendiagnosis jika Anda mengalami serangan jantung, atau untuk menemukan instruksi tentang pembuatan bom.

Terserah orang membuat produk untuk berpikir kritis tentang implikasi sosial dan etis dari pekerjaan mereka. Ini adalah kebenaran yang disayangkan bahwa banyak hal yang dibangun dengan niat terbaik dapat disalahgunakan untuk kejahatan. Itu pertanyaan yang sulit.

Sam: Leo, terima kasih banyak.

Leo: Menyenangkan mengobrol, Sam.

Currently unrated

Comments