Data Analytic : Membangun model Machine Learning

 1. Data adalah : Data adalah kumpulan informasi tentang peristiwa berulang yang mencakup angka, fakta, gambar, tabel, grafik, kata, simbol, dan lainnya untuk digunakan sebagai dasar analisis dan penarikan kesimpulan. Data dapat berupa keterangan yang benar dan nyata, keterangan atau bahan nyata yang dapat dijadikan dasar penelitian, dan informasi mengenai suatu hal yang sudah sering terjadi dan berupa serangkaian angka, fakta, gambar, tabel grafik, kata, simbol, huruf, dan lainnya yang mengekspresikan suatu pemikiran, kondisi, objek, dan situasi.


2. Data Analyst: Data Analyst adalah profesional yang mengumpulkan, mengorganisir, dan menganalisis data untuk membantu organisasi membuat keputusan yang lebih baik. Mereka menggunakan berbagai alat dan teknik, termasuk perangkat lunak statistik dan metode visualisasi data, untuk mengidentifikasi tren, pola, dan korelasi dalam data. Data Analyst biasanya bekerja di industri seperti keuangan, kesehatan, dan pemasaran, di mana insights data-driven sangat penting untuk strategi bisnis dan pengambilan keputusan.


3. Big Data: Big Data adalah set besar dan kompleks data yang dihasilkan dari berbagai sumber, seperti media sosial, sensor, dan perangkat digital lainnya. Big Data dikarakteristikkan oleh volume, kecepatan, dan variasi, yang dapat menjadi tantangan untuk diolah dan dianalisis menggunakan alat pengolahan data tradisional. Big Data sering digunakan dalam aplikasi seperti penambangan data, pembelajaran mesin, dan visualisasi data.


4. Pandas DataFrame : Pandas DataFrame adalah struktur data dua dimensi dalam Python yang digunakan untuk menyimpan dan mengolah data tabular. DataFrames mirip dengan spreadsheet atau tabel dalam basis data relasional. DataFrames sangat berguna untuk tugas analisis data seperti filtering, sorting, dan mengelompokkan data. Mereka juga digunakan untuk visualisasi data dan pengolahan data.


5. Library Visualisasi Data Pada Bahasa Python : Python memiliki beberapa library yang digunakan untuk visualisasi data, termasuk Matplotlib dan Seaborn. Library-library ini memberikan berbagai alat untuk membuat plot, chart, dan representasi visual lainnya dari data. Mereka digunakan secara luas dalam analisis data dan komputasi ilmiah untuk membantu pengguna memahami dan berkomunikasi tentang insights data kompleks.


6. Machine Learning : Machine Learning adalah subbidang dari Ilmu Komputer yang melibatkan pelatihan algoritma untuk membuat prediksi atau keputusan berdasarkan pola dalam data. Machine Learning digunakan secara luas dalam aplikasi seperti pengenalan gambar, pengolahan bahasa alami, dan sistem rekomendasi. Machine Learning sering digunakan bersama dengan analisis data untuk mengidentifikasi tren dan membuat prediksi tentang hasil masa depan.


7. Outlier pada data analytic : Outlier dalam analisis data adalah data point yang sangat berbeda dari data lainnya. Mereka dapat disebabkan oleh berbagai faktor seperti kesalahan pengumpulan data, kejadian tidak biasa, atau anomali dalam data. Outlier dapat mempengaruhi akurasi analisis data dan model, sehingga penting untuk mengidentifikasi dan menghandle mereka dengan baik.


8. Model Supervised Learning : Model Supervised Learning adalah jenis pembelajaran mesin di mana algoritma dipelajari pada data yang telah ditandai untuk mempelajari hubungan antara fitur input dan label output. Tujuan adalah membuat prediksi pada data yang belum pernah dilihat sebelumnya. Model Supervised Learning digunakan secara luas dalam aplikasi seperti pengenalan gambar, pengolahan bahasa alami, dan analisis sentiment.


9. Cross Validation Sampling : Cross-validation adalah teknik yang digunakan dalam pembelajaran mesin untuk mengevaluasi kinerja model dengan membagi data menjadi set training dan testing. Hal ini membantu mencegah overfitting dan memastikan model dapat digeneralisasi ke data yang belum pernah dilihat sebelumnya. Cross-validation sangat berguna ketika bekerja dengan data kecil atau ketika data yang tersedia terbatas.


10. Hyperparameter Tuning : Hyperparameter Tuning adalah proses mengatur parameter model pembelajaran mesin untuk mengoptimalkan kinerja model. Hal ini biasanya dilakukan menggunakan teknik seperti search grid atau search acak. Hyperparameter Tuning sangat penting dalam pembelajaran mesin, karena dapat mempengaruhi akurasi dan efisiensi mode.


SOURCE :

[1] https://mediaindonesia.com/teknologi/532475/data-adalah-pengertian-manfaat-dan-jenisnya

[2] https://www.coursera.org/learn/data-analysis-with-python

[3] https://pasla.jambiprov.go.id/pengertian-data-manfaat-dan-fungsi-jenis-dan-contohnya/

[4] https://id.linkedin.com/company/data-science-indonesia

[5] https://www.datacamp.com/tracks/data-analyst-with-python

Komentar

Postingan populer dari blog ini

Mengenal Apa Itu JavaScript? Fungsi hingga Cara Kerjanya

Mengenal apa itu OOP (Object-Oriented Programming)

GitHub dan GitLab: Dua Rekayasa Pengelolaan Kode