3 poin dari Lokakarya Nasional tentang Pendidikan Ilmu Data

Seiring berkembangnya lapangan, ada banyak hal yang dapat kita lakukan untuk memberi manfaat bagi siswa yang tak terhitung jumlahnya.

 

Minggu lalu, saya menghadiri Lokakarya Pendidikan Ilmu Data Nasional yang diselenggarakan oleh University of California, Berkeley. Selama di sana, saya melakukan percakapan yang menarik dengan berbagai orang yang entah bagaimana didedikasikan untuk penyebaran ilmu data.

Di atas adalah salah satu cuplikan singkat dari percakapan semacam itu. Profesor yang membuat pernyataan ini memiliki poin yang valid yang membuat tujuan keseluruhan pertemuan jauh lebih penting.

Saat ini, tidak ada sejumlah besar departemen ilmu data di luar sana. Bahkan mereka yang mempelajari ilmu data sebagai sarjana sebagian besar bertempat di departemen seperti ilmu komputer, ilmu informasi, dan statistika. Di satu sisi, ini bijaksana karena ilmu data itu sendiri berada di persimpangan dari banyak disiplin ilmu yang berbeda.

Meskipun demikian, karena keahlian keseluruhan menjadi lebih didambakan, lembaga akademik lebih cenderung mengajarkannya “secara resmi”. Di tahun-tahun mendatang, kita dapat mengharapkan perluasan akses yang signifikan ke pendidikan ilmu data di tingkat sekolah menengah dan perguruan tinggi.

Ketika ekspansi ini terjadi, penting untuk memperhatikan bagaimana program-program ini terstruktur dan untuk belajar dari kesalahan masa lalu untuk memastikan masa depan yang sukses. Pada artikel ini, saya akan membahas tiga refleksi utama dari berpartisipasi dalam Lokakarya Pendidikan Ilmu Data Nasional, yang menurut saya pribadi sangat penting untuk merancang kurikulum ilmu data.

 

Poin Kursus Intro: Teori dan Kepraktisan

Kursus pengantar ilmu data di University of California, Berkeley disebut Data 8: Foundations of Data Science. Ini adalah salah satu kursus terbesar di kampus dan menarik siswa dari semua latar belakang, terutama karena tidak mengasumsikan tidak ada pengalaman pemrograman. Pertemuan multi-fakultas  anggota fakultas menjadi poin utama diskusi pada hari pertama lokakarya karena mereka menghabiskan bertahun-tahun merancang kursus ini menjadi seluas dan seefektif mungkin.

Salah satu fitur utama Data 8 adalah bahwa ia beroperasi dari filosofi inti yang menjanjikan bagi sebagian orang dan menghancurkan bagi yang lain: ilmu data yang efektif diajarkan pada awalnya, bahkan tanpa pengetahuan teoretis yang mendalam tentang statistik yang mendasarinya. Data 8 mengajarkan siswa untuk menggunakan komputasi sebagai alat untuk memproses dan menganalisis kumpulan data besar, sambil memperkenalkan konsep statistik sesuai kebutuhan di sepanjang jalan.

Ini memberikan berbagai manfaat, termasuk:

  • Aksesibilitas yang ditingkatkan ke ilmu data
  • Pengantar yang lembut cenderung tidak menakut-nakuti siswa (mari kita hadapi itu – sebagian besar siswa, terutama di Amerika Serikat, takut pada matematika)
  • Output cepat dari ilmuwan data yang kompeten di dunia yang sangat membutuhkan mereka

Meskipun demikian, paradigma tersebut bukan tanpa oposisi. Banyak ahli statistik hardcore berpendapat bahwa pengajaran semacam itu berbahaya karena berusaha membangun seluruh keterampilan yang ditetapkan di atas fondasi yang tidak ada di sana — mirip dengan membangun puncak piramida sebelum fondasi itu. Tidak ada peluang untuk sukses.

Saya dapat memahami perasaan ini (sebagai seseorang yang menikmati matematika sendiri), tetapi saya pikir itu agak dramatis. Bukannya siswa tidak pernah belajar statistik dan matematika, yang merupakan dasar dari ilmu data. Dua bagian piramida dibangun secara terpisah di tanah dan akan disatukan nanti. Tidak masalah apakah bagian atas dibangun terlebih dahulu atau tidak. Selain itu, bahkan bagian atas saja sudah cukup untuk mulai mengatasi masalah dunia nyata dengan cara yang efektif. Fakta sederhananya adalah bahwa rata-rata ilmuwan data tidak perlu mengetahui seluk-beluk keturunan gradien jika mereka dapat mengimpor model dari SK-Learn dan menerapkannya ke himpunan data.

Tentu saja, ini adalah topik terbuka dan maksud saya, saya tidak akan memaksakan pendapat saya pada Anda. Sebaliknya, saya menyajikan poin ini sebagai diskusi yang sedang berlangsung –  jika Anda akan menjelajah (atau sudah berenang) ke dunia pendidikan ilmu data, saya mendorong Anda untuk berpikir secara mendalam.

 

Pentingnya Data Dunia Nyata

Mengajar sering membantu dalam desain masalah bodoh dan dibuat-buat dalam upaya untuk mengajar siswa keterampilan tertentu. Kami semua berurusan dengan beberapa versi berikut ketika kami masih di sekolah dasar:

Tommy pergi ke toko untuk membeli makanan untuk ketiga anaknya. Semua orang ingin makan tiga semangka untuk makan malam, dan Anda membutuhkan dua semangka untuk masing-masing semangka. Berapa banyak semangka yang perlu dibeli Tommy untuk memuaskan semua orang, termasuk dirinya sendiri?

Ketika kita maju melalui tahun-tahun pendidikan, masalahnya menjadi lebih kompleks dan mungkin kurang konyol, tetapi satu fakta cenderung bertahan: mereka tidak terlalu realistis.

Namun, ini tidak harus terjadi dalam ilmu data. Ada sejumlah besar kumpulan data yang tersedia untuk umum di zaman modern, dan tidak ada alasan bagus mengapa kami tidak dapat memasukkannya ke dalam kursus kami. Para presenter lokakarya sangat mementingkan hal ini.

Dengan menggunakan data dunia nyata, pertanyaan yang lebih dalam dapat secara otomatis dimasukkan ke dalam kurikulum.

  • Apa yang harus saya lakukan jika data saya tidak dalam format yang cocok untuk analisis?
  • Bagaimana Anda bisa berbuat baik di dunia melalui praktik ilmu data?
  • Apa implikasi etis dari penelitian ini?

Ini menuntun pada wawasan penting yang mungkin hilang dari siswa Anda. Dengan menggunakan data dunia nyata sejak awal, kita secara otomatis mulai menjawab pertanyaan yang sangat penting dalam pengaturan pendidikan, tetapi sering diabaikan: Mengapa kita melakukan ini?

Jangan bercanda seperti berpikir ini mudah. Mungkin sangat sulit untuk menemukan kumpulan data yang tepat untuk tujuan pembelajaran tertentu yang ingin dicapai siswa setiap minggu. Para profesor di lokakarya mengaku menghabiskan banyak waktu untuk tugas yang tampaknya sederhana ini. Anda harus siap untuk melakukan hal yang sama.

Tapi ketahuilah bahwa itu sepadan.

Etika tidak boleh menjadi “kebersamaan”

Akhirnya, seperti yang diharapkan dalam dorongan modern menuju pendidikan ilmu data, bagian dari lokakarya ini didedikasikan untuk diskusi etis. Namun, cara presenter mendekat menarik perhatian saya.

Dalam konteksnya, topik ini muncul ketika beberapa pendidik di Berkeley sedang mendiskusikan perluasan program ilmu data selama beberapa tahun ke depan. Mereka memberi tahu kami bahwa mereka awalnya berpikir bahwa mereka hanya akan memiliki satu atau dua kursus etika sebagai bagian penting dari kurikulum.

Tetapi kemudian mereka menyadari lagi bahwa mereka membuat kesalahan fatal dengan pada dasarnya “mengesampingkan” etika pekerjaan, padahal sebenarnya itu harus menjadi fondasi. Dalam banyak hal, banyak masalah etika yang kita hadapi di dunia teknologi saat ini berasal dari paradigma cacat yang serupa.

Jadi mereka kembali ke titik awal 1 dan memutuskan pendekatan yang berbeda sebagai gantinya. Ketika mereka merancang kurikulum (dan saat saya menulis ini, program ini masih dibangun, jadi kami terus merancang), mereka memasukkan argumen etis ke dalam bagian dari setiap silabus dan menyesuaikannya agar sesuai dengan topik spesifik kelas.

Ini adalah pendekatan yang jauh lebih baik, dan semua ilmuwan data, terutama mereka yang mengajar orang lain, baik formal atau tidak, dapat belajar darinya. Secara konsisten membahas etika (semua mata kuliah) dan terutama (terkait langsung dengan materi mata kuliah) akan menjadi topik penting bagi mahasiswa di lapangan sejak awal.

Dengan mengadopsi paradigma ini, kita dapat mengamankan masa depan yang ideal untuk ilmu data — masa depan yang sangat menguntungkan masyarakat tetapi bebas dari kerusakan jaminan yang tidak dapat diperbaiki dalam prosesnya.

 

Pikiran terakhir: Apa itu praktik data yang bertanggung jawab?

Akhirnya, saya ingin berbagi beberapa pemikiran terakhir dari lokakarya itu sendiri. Menjelang akhir presentasi, dibahas prinsip-prinsip komprehensif berikut: Mereka sengaja dibiarkan ambigu – dan saya menahan diri untuk tidak membuang pikiran saya sendiri – saya  pikir cara yang tepat untuk mengakhiri artikel ini adalah dengan mendorong orang untuk berpikir tentang apa arti masing-masing dari berikut ini bagi Anda, terutama dalam konteks dunia yang berpusat pada data.

  • Memahami Dunia
  • Bayangkan apa yang dapat Anda lakukan
  • Reflektivitas terhadap diri sendiri
  • Kerentanan terhadap konteks etika
  • Komitmen terhadap keadilan
  • Kritik terhadap sistem yang tidak adil

Tentu saja, jangan berhenti pada refleksi. Gabungkan cita-cita ini ke dalam semua aspek pekerjaan ilmu data Anda, terutama membimbing orang lain. Jika kita semua melakukan itu, masa depan cerah.

 

 

Leave a Reply

Your email address will not be published.