POSIT: Versi Terbaru R Studio dengan Python
Sebuah Peluang Atau Ancaman?
Dalam melakukan analisis data mulai dari metode yang paling sederhana sampai dengan deep learning, setiap data scientist memiliki ketertarikan yang berbeda dalam menggunakan perangkat olah data. Kebanyakan Statistisi menggunakan R software, karena menawarkan fitur library atau package yang beragam. Namun, pegiat computer scientist lebih menyukai python karena menawarkan library untuk melakukan kajian deep learning, dimana python memiliki banyak package yang dapat digunakan untuk kajian machine learning dan deep learning.
Beberapa Statistisi dapat menggunakan environment pada python yang di kolaborasi dengan R. Tujuannya adalah parameter yang dihasilkan pada model parametrik tersebut yang dihasilkan pada software R, kemudian dapat dilatih dengan machine learning dan deep learning yang didapatkan dari library yang berada pada keras di Python, beberapa kajian menyebutkan ini adalah ‘Hybrid Methods’.
Hal tersebut yang bisa menjadi pelopor hadirnya POSIT. Menurut pada website official POSIT yang dilansir pada situs (https://posit.co ). POSIT akan official launching pada Oktober 2022 yang dapat dilihat pada Gambar 1.
Tujuan dari POSIT ini adalah diharapkan dapat menjadi media yang baik untuk kolaborasi environment di R dan juga Python.
Namun, ini menjadi tantangan sendiri bagi Statistisi maupun Data Scientist yang mengembangkan R Package. Sejauh ini peneliti sudah menerbitkan 2 package yang bernama hsem: Hierarchical Structural Equation Model dan NASPACLUST.
Ancaman bergabungnya R software dengan Python adalah akan menyulitkan maintainer oleh R software developer untuk membuat coding yang ‘seimbang’ yang dapat digunakan oleh fitur di POSIT. Dikarenakan POSIT ini adalah media yang dapat digunakan untuk R Code dan juga Python Code. Apabila maintainer R package tidak mengupdate package tersebut sedini mungkin, maka terancam akan hilang pada R library karena tidak support environment yang baru. Seperti yang dapat dilihat pada Gambar 2.
Namun, tantangan tersebut akan mengubah paradigma penelitian statistika dan data scientist dimasa mendatang. Jika pegiat Statistisi pada bidang time series mengikuti Markidakis-Competition (M-Competition). Target pada M-6 ini akan lebih banyak membahas tentang data real saham amerika serikat 50 S&P500. Pelajaran dari M-5 statisisi perlu lebih banyak mengembangkan metode dalam prediktif yang dapat digunakan untuk reasoning dan juga akurasi tinggi, seperti yang sudah diketahui bahwa kelemahan metode deep learning adalah model yang black-box, sukar untuk di interpretasi.
Silakan komentar di thread ini mengenai tanggapan teman-teman semua!
Rezzy Eko Caraka
Peneliti, Pusat Riset Sains data dan Informasi, BRIN