Bahasa menjadi Sarjana Sains Data
Peluang Karier Data Scientist bersama Ardya Dipta, Senior Data Scientist GOJEK
Isi kandungan:
Semua orang mahu kerjaya mereka berada dalam permintaan tinggi-kerana permintaan diterjemahkan kepada gaji yang besar dan tidak ada kekurangan kerja. Hari-hari ini, ruang data besar dipenuhi dengan pekerjaan seperti itu, kerana syarikat dari semua saiz perlu mengumpulkan dan menganalisis maklumat untuk membuat keputusan dan ramalan (dan mendapatkan hasil).
Itulah yang dilakukan saintis data: mencari maklumat, membuat sambungan, membuat visualisasi data, dan membantu syarikat beroperasi dengan cekap. Dan pemahaman menyeluruh mengenai bahasa pengaturcaraan yang betul adalah penting untuk menafsirkan statistik dan bekerja dengan pangkalan data.
Menurut KDnuggets, 91% saintis data menggunakan empat bahasa berikut.
Bahasa 1: R
R adalah bahasa berorientasikan statistik yang popular di kalangan penambang data. Ia merupakan sumber terbuka, pelaksanaan berorientasikan objek S, dan tidak terlalu sukar untuk dipelajari.
Jika anda ingin belajar bagaimana membangunkan perisian statistik, R adalah bahasa yang baik untuk diketahui. Ia juga membolehkan anda memanipulasi dan memaparkan data grafik.
Sebagai sebahagian daripada program Pengkhususan Sains Data mereka, Coursera menawarkan kelas pada R yang bukan hanya mengajar anda bagaimana untuk memprogram dalam bahasa tetapi juga menerangkan cara menerapkannya dalam konteks sains / analisis data.
Bahasa 2: SAS
Seperti R, SAS digunakan terutamanya untuk analisis statistik. Ini alat yang berkuasa untuk mengubah data dari pangkalan data dan spreadsheet ke format yang boleh dibaca (seperti dokumen HTML dan PDF) serta jadual dan graf yang lebih visual.
Mula-mula dibangunkan oleh penyelidik akademik, ia telah menjadi salah satu alat analitik yang paling popular di seluruh dunia untuk syarikat dan organisasi dari semua jenis. Ia lebih daripada jenis perisian perbadanan yang besar dan tidak biasanya digunakan oleh syarikat atau individu yang lebih kecil yang bekerja sendiri.
Sumber untuk pembelajaran SAS disenaraikan dalam dokumen ini. Bahasa ini bukan sumber terbuka, jadi anda mungkin tidak dapat mengajar diri anda secara percuma.
Bahasa 3: Python
Walaupun R dan SAS dianggap paling "dua besar" dalam dunia analisis, Python baru-baru ini menjadi pesaing juga. Salah satu faedah utamanya ialah pelbagai jenis perpustakaan (mis. Pandas, NumPy, SciPi, dll.) Dan fungsi statistik.
Oleh kerana Python (seperti R) adalah bahasa sumber terbuka, kemas kini ditambah dengan cepat. (Dengan program yang dibeli seperti SAS, anda perlu menunggu pembebasan versi seterusnya.)
Faktor lain yang perlu dipertimbangkan ialah Python mungkin adalah yang paling mudah untuk dipelajari, kerana kesederhanaannya dan ketersediaan kursus dan sumber yang luas di dalamnya. Laman web LearnPython adalah tempat yang bagus untuk bermula.
Anda juga boleh mencari senarai lengkap bahan pembelajaran Python.
Bahasa 4: SQL
Setakat ini kami telah melihat bahasa yang ada dalam keluarga yang sama dan (kurang lebih) mempunyai fungsi yang sama. SQL, yang bermaksud "Bahasa Permintaan Berstruktur," adalah di mana perubahan itu. Bahasa ini tiada kaitan dengan statistik; ia memberi tumpuan kepada pengendalian maklumat dalam pangkalan data hubungan.
Ia adalah bahasa pangkalan data yang paling banyak digunakan dan merupakan sumber terbuka, jadi saintis data yang bercita-cita pasti tidak harus melewatinya.
Pembelajaran SQL harus melengkapkan anda untuk membuat pangkalan data SQL, menguruskan data di dalamnya, dan menggunakan fungsi yang berkaitan. Udemy menawarkan kursus latihan yang merangkumi semua asas dan dapat diselesaikan dengan cepat dan tanpa rasa sakit.
Kesimpulannya
Sekurang-kurangnya, anda mungkin perlu mempelajari SQL dan memilih sekurang-kurangnya salah satu bahasa statistik. Tetapi jika anda mempunyai masa (dan dalam kes SAS, wang) dan ingin benar-benar sehingga ke pasaran anda, tidak ada yang mengatakan anda tidak boleh belajar semua empat!
Jangan tergesa-gesa, dapatkan banyak latihan, mengasah kemahiran anda-dan nikmati keselamatan pekerjaan.
Bagaimana Bahasa Tubuh & Menjadi Pengaruh Temuduga Kerja Anda
Artikel ini menerangkan bagaimana kemahiran dan penampilan tidak ketara mempengaruhi hasil wawancara kerja.
Senarai Kemahiran Data Sains dan Contoh
Seorang saintis data menganalisis data untuk mempelajari proses saintifik. Senarai kemahiran ini boleh digunakan untuk resume, cover letter, dan wawancara kerja.
Adakah anda layak untuk menjadi ahli sains forensik?
Sebelum anda mendapatkan seting jantung anda untuk mendapatkan pekerjaan sebagai ahli sains forensik, anda perlu memastikan anda layak untuk kerja di tempat pertama.