[Musik] bertemu kembali dengan saya Pak Yahya di mata kuliah literasi digital dan kemanusiaan Pada kesempatan kali ini saya akan berbicara tentang Big data namun sebelum itu Mari kita bahas dulu tentang capaian pembelajaran kita di pertemuan kali ini yaitu cpmk ketiga diharapkan Nanti para mahasiswa mampu mengaplikasikan berbagai konsep teoritis dasar tentang media informasi di dunia cyber teknologi digital dan pemanfaatannya secara Humanis pada masyarakat abad ke-21 dalam penyelesaian masalah secara kontekstual kemudian subjek PMK dari cpmk ketiga yaitu diharapkan nanti mahasiswa menguasai konsep teoritis tentang iot dan big data yang menjadi penopang dari masyarakat di abad ke-21 serta mampu menerapkannya dalam kehidupan kesehatan keseharian secara bijak dan Humanis Adapun outline materi kita pada pertemuan kali ini ada enam yang pertama adalah pengertian big data Kemudian yang kedua konsep big data yang ketiga Head of Big data kemudian yang keempat job time big data kemudian yang kelima potensi big data dan terakhir adalah data mining dan b itu Apa itu Big data mungkin dari kalian tidak asing ya dengan kata data namun ada bignya big datanya istilah untuk data sangat besar dan kompleks yang tidak dapat dikelola di capture di store mana [Musik] dengan software dan tool pemrograman database biasa atau konvensional tidak cukup dengan SQL biasa saja relational database management system sehingga butuh teknologi baru atau tambahan no SQL yang tidak menggunakan SQL not only SQL kemudian tidak hanya berisi data berstruktur atau relasional tapi juga mayoritas tidak berstraktur ya tidak berstruktur atau anstruktur kemudian apa yang besar big data dari sisi volume Volume data yang super besar kondisi saat ini misal puluhan terabait hingga puluhan peta bait contoh vldb atau data-data dari [Musik] perusahaan yang besar Kemudian dari sisi velocity munculnya data ya dan frekuensi perubahan data dalam satuan waktu puluhan terhadap per detik misalkan kalian menjadi konten kreator di YouTube berapa konten yang dihasilkan di tik tok begitu ya kemudian variety jenis data yang sangat beragam berstruktur tak berstruktur dan lain sebagainya itu kemudian ada konsep 3v4v5v tentunya 3v tadi berkembang menjadi 4 V dan 5v volume ukuran data sangat besar dari sisi jumlah yang mencapai miliaran GB gitu ya bukan velocity kecepatan data sangat besar dari sisi kemunculan dan perubahannya variety variasi jenis atau tipe data sangat banyak atraktor dan multi struktur value nilai yang dihasilkan juga sangat besar dari sisi manfaat dalam bentuk uang maupun non uang kemudian veracity kebenaran dan keakuratan Informasi yang tidak mudah dipastikan misal salah ketik di Twitter dan lain sebagainya volume Volume bertambah secara eksponensial pada tahun 2015 dari 8 zitab baik 8000 beta baik menjadi 8 juta eks tape menjadi 8 miliar l sampai 8 triliun Gigabyte volume data di sini kalian bisa melihat berapa data di Amerika di Asia di Jepang kemudian big velocity pertambahan dari tahun 2011 Twitter 7 terabyte per hari Facebook 10 terabyte per hari sumbernya dari data university. com tahun itu belum muncul Tik Tok Itu bisa kalian asumsikan berapa data per hari yang digunakan oleh Tik Tok kemudian big people to people banyak varietas datanya people to mesin mesin itu mesin ya data yang didapatkan dari orang ya Dari orang ke mesin Kemudian dari mesin dari sensor ya yang didapatkan oleh iot yang pernah kita bahas sebelumnya variasinya banyak kemudian masuk ke Head of dan big data jadi memproses himpunan data berskala besar atau big data dalam beberapa Cluster hardware komputer dikembangkan menggunakan bahasa Jawa beberapa menggunakan si dan utilitas command Line sebagai sales scriptnya kemudian dikembangkan oleh software foundation a page. org 2007 di bawah lisensi V2 kemudian masuk ke job type for big data ya jadi banyak pekerjaan yang sekarang membutuhkan seorang ahli dalam bidang big data misalkan yang pertama ini adalah Head of Developer S desain data Warehouse data-data yang sudah dimilikinya [Musik] kemudian skill yang dibutuhkan apa Java ya scripting Linux kemudian Ada pekerjaan lagi sebagai Head of admin job functionnya ngapain dia Mana cluster desain data pipeline ya Skill yang dibutuhkan Linux administration Network management experience in managing Lords Cluster of [Musik] kemudian ada pekerjaan sebagai data Scientist pekerjaannya ngapain data mining and figuring out hidden knowledge in data ya jadi datanya diolah skillnya apa Met data mining algoritma kemudian yang terakhir pekerjaan apa saja yang bisa business menganalisis data skill yang dibutuhkan ada pick HIV SQL familiality with dan lain sebagainya gitu ya jadi banyak pekerjaan yang bisa kalian dapatkan dari ilmu bidang potensi big data jumlah data yang telah dibuat dan disimpan pada tingkat Global hari ini Hampir tak terbayangkan jumlahnya data tersebut terus tumbuh tanpa henti sayangnya sampai saat ini baru sebagian kecil data yang telah dianalisis jadi data itu belum teranalisis dengan baik pentingnya big data tidak hanya seputar pada jumlah data yang dimiliki tetapi hal yang penting adalah bagaimana mengolah data data tersebut untuk mengambil keputusan untuk decision ya mengambil keputusan misalnya menganalisa data untuk menemukan jawaban yang diinginkan dalam kegiatan bisnis seperti pengurangan biaya pengurangan waktu pengembangan produk baru dan optimalisasi penawaran produk dan pengambilan keputusan yang cerdas kemudian Apa itu data Mini disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu data yang besar ekstrasi dari data ke pengetahuan bisa melalui dua yang pertama adalah data fakta yang terekam dan tidak membawa arti Kemudian yang kedua adalah pengetahuan itu berupa pola rumus aturan atau model yang muncul dari data yang ada nama lain dari data mining ada knowledge Discovery in database kdd ada knowledge Extraction ada partton analysis ada information harvesting ada bisnis intelijens jadi banyak istilah tentang ini bagaimana proses data mining sehingga diperoleh sebuah knowledge atau pengetahuan yang pertama berupa database yang didapatkan kemudian data ini dibersihkan pembersihan data data Warehouse kemudian datanya tes relevan data datanya di tes dikasih uji coba kemudian diselection ya datanya di seleksi kemudian baru diproses untuk data mining kemudian diberikan Parton Evolution sehingga diperolehlah sebuah knowledge proses ini kami dapatkan dari web CS dan UI uc.
id kemudian metode data mining ada estimation estimasi ada linier neural Network support Factor mesin dan lain sebagainya kemudian prediction atau forecasting prediksi atau peramalan metodenya ada linear regression neural Network support Factor mesin dan lain sebagainya kemudian ada klasification klasifikasi metodenya ada naik bus c4. 5 ID 3 chart linear diskriminate Logistic regulation dan lain sebagainya kemudian Cluster Cluster ring ada metodenya kemudian ada Association asosiasi metodenya ada Fb gold koefisien of relation [Musik] top data mining software yang digunakan dari kade nuggets.