Pengetahuan Umum Sosial Media Analytic (SMA) dan Sosial Network Analysis (SNA)

Digital Data Gathering

  • Sosial Media Analytic (SMA) adalah sebuah proses pengumpulan data dari media sosial dan analisanya untuk mendapatkan “insights” atau informasi berharga untuk suatu tujuan tertentu (definisi diadopsi dari Gartner*).
  • Sosial Network Analytic (SNA) adalah proses menyelidiki struktur sosial melalui penggunaan jaringan dan teori graf [Otte, Evelien; Rousseau, Ronald (2002)], Terdapat berbagai macam cara untuk membentuk Graph dari data media sosial: retweet, mention, followers, friends dan lain-lain.
  1. Social Media Crawling
  2. Social Media Streaming
  3. Sekilas Privacy & Ethics Data Gathering
  4. Scrapping Media Social & Website

Social Media Real-World Applications

  • Customer Behaviour, Campaign Performance, Customer interest, Competitive Analysis, Customer Satisfaction, Review Analysis.
  • Business insights for investors.
  • Counter terrorism (National security/defence)
  • Health, Natural disasters mitigation, etc.

SMA-SNA Techniques

  • SMA: Sentiment Analysis, Topic Modelling, Gender/Age Prediction, Spatial Analysis, Hashtag Analysis, Hoax Detection, Viral Prediction, etc.
  • SNA: Centrality Analysis, Community Detection, recommender system, etc.

Social Media/Network Analysis Technology/ Tools

  • Neo4j – Graph Database, Elasticsearch – Text Search Engine & NoSQL
  • Apache Kafka – Handling multi stream realtime input data.
  • Gephi – Graph Visualization
  • VoyantTools – Text Visualization & Analysis
  • NetworkX: Python Modules – Graph Programming
  • NLTK-Spacy: For Text Related Analysis.
  • Spark/ Hadoop: for big data DDDC.

Tantangan SMA

  • Pendek (Short in lengths): bahkan terkadang tidak mengandung sebuah kalimat yang utuh menurut tata bahasa (grammar).
  • Noise : Data media sosial penuh dengan noise seperti typos (salah ketik), encoding yang tidak jamak, slang, dsb.
  • Temporal : Informasi yang sedang trending biasanya hanya sesaat,
    sehingga SMA diharapkan dilakukan dengan cepat menggunakan model-model/teknik-teknik analisa data yang efisien
  • High-dimensional: Data di Media Sosial (Teks, Gambar, Video, Suara, dsb) adalah data tidak terstruktur berdimensi tinggi.
  • Fine-grained: Data di media sosial berasal dari banyak user yang masing-masingnya bisa jadi membahas beberapa topik yang berbeda. Sehingga komunitas (kelompok), topik, maupun klasifikasi yang ada menjadi besar (fine-grained).
  • Large in volume & High velocity: Data yang sangat besar dan bertambah besar dengan cepat.
    A lot of external Information : Informasi terkadang lebih banyak terkandung dari luar (eksternal) seperti url website, video, atau hal lain yang dibagikan oleh pengguna media sosial.

Digital Data Gathering (DDG): Scrapping, Crawling, & Streaming

  • Streaming: teknik pengiriman data (media) secara kontinu & real-time.
  • Scrapping secara umum (minimal) tidak etis (bisa jadi ilegal). Mengapa? karena scraping mirip DDOS attack yang akan memberatkan server atau bahkan membuat server berhenti berfungsi normal. Program scraping juga memungkinkan akan mengakses data yang tidak dimaksudkan untuk konsumsi publik.
  • Satu-satunya saat dimana scraping boleh dilakukan adalah saat sang pelaku/programer menghormati “robots.txt” yang telah diberikan oleh web administrator. Atau lebih baik lagi adalah menggunakan API (Application Program Interface) yang diberikan oleh provider (website/medsos) lalu melakukan crawling.
  • Yakinkan untuk membaca ToS (Terms of Sevice) dengan baik.

Sumber

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *