Anda di halaman 1dari 8

1. How the data was collected? What are the keywords? Discuss the detail of your dataset.

How will
you arrange the dataset for analysis purposes?
2. The visualization of the graph (you can use any network analysis apps, e.g., gephy). Please discuss
the characteristics of the graph/network based on the visualisation.
3. Statistical analysis of the network. You may use the facilities provided by software. However, you
still need to describe and discuss the measures that you used.

Jawaban:
1. Data yang saya pakai adalah data twitter tentang “Elon Musk Tweets Dataset (17K)”, data ini saya
ambil dari Kaggle dengan link: https://www.kaggle.com/datasets/yasirabdaali/elon-musk-tweets-
dataset-17k
2. Program yang saya gunakan untuk visualisasi graph/network adalah program Gephi
Berikut penjelasan Network/Graph tersebut :

Datasets ini memiliki 50133 nodes, 159339 edges, dan menggunakan Directed Graph
a. Average Degree

Average degree diperoleh dari average degree, in degree, dan out degree. Diketahui bawah
average degreenya adalah 3178. Yang artinya bahwa 1 hashtag akan keluar 3 hashtag yang
bersamaan.
Pada grafik degree dapat dilihat bahwa yang ngetweet Date itu ada 10, kemudian
created,Number hanya ada 1 , kemudian of ada 1005 dan seterusnya. Kemudian in
degreenya ada yang 0, 1, 1005 dan seterusnya. Dan out degree nya ada yang 4, 0 , 0 dan
seterusnya. Jadi pada grafik degree, in degree, out degree yang bagian garisnya vertical atau
y menggambarkan banyaknya tweet
b. Network Diameter
Diameter nya 16 dan panjang rata-ratanya adalah 3.936416587036788

Grafik menunjukkan terdapat 2 titik, yang mana titik 0 memiliki frekuensi sebanyak 0 dan
45000. Ini menandakan bahwa node-node ini tidak berperan enting dalam menghubungkan
jalur terpendek antara node-node lainnya dalam jaringan.
Grafik diatas pada x 0 sebanyak >45000, x antara 0 dan 1 sebanyak 1 dan x 1 sebanyak 1.
Pada sumbu x dengan nilai 0, terdapat 45000 node dalam jaringan yang memiliki nilai
closeness centrality 0. Ini berarti node-node ini tidak dapat mencapai node-node lain dalam
jaringan dalam jumlah langkah minimum, sehingga memiliki jarak yang relatif lebih jauh
dari node-node lainnya. Pada sumbu x antara 0 sampai 1 (interval), terdapat 1 node. Ini
berarti ada satu node dalam jaringan yang memiliki nilai closeness centrality di antara 0 dan
1. Nilai ini menunjukkan bahwa node tersebut dapat mencapai node-node lain dalam
jumlah langkah minimum yang lebih kecil dibandingkan dengan node-node pada sumbu x 0.
Pada sumbu x dengan nilai 1, terdapat 1 node. Ini menunjukkan bahwa ada satu node
dalam jaringan yang memiliki nilai closeness centrality maksimum, yaitu 1. Node ini
merupakan node yang paling dekat dengan semua node lain dalam jaringan, dengan jarak
yang paling pendek dalam jumlah langkah minimum.
Pada grafik diatas Weakly Connected Components nya 18 dan Strongly Connected
Components nya 50120 dan terdapat 2 titik yaitu di 1 dan 16.
1. Weakly Connected Components (Komponen Terhubung Lemah): Terdapat 18 komponen
terhubung lemah. Komponen terhubung lemah adalah kelompok node-node dalam
jaringan di mana ada jalur yang menghubungkan setiap pasangan simpul, baik secara
langsung maupun melalui node-node lain. Dalam konteks ini, jaringan dapat dibagi
menjadi 18 kelompok terpisah yang saling terhubung secara lemah.
2. Strongly Connected Components (Komponen Terhubung Kuat): Terdapat 50120
komponen terhubung kuat. Komponen terhubung kuat adalah kelompok node-node
dalam jaringan di mana setiap simpul dapat dicapai dari setiap simpul lain dalam
kelompok melalui jalur yang mengikuti arah koneksi. Dalam konteks ini, jaringan terdiri
dari 50120 kelompok terpisah yang saling terhubung secara kuat.
3. Terdapat 2 titik pada nilai 1 dan 16: Ini mengacu pada distribusi ukuran (size) simpul
dalam jaringan. Titik pada nilai 1 menunjukkan bahwa ada node-node dalam jaringan
dengan ukuran (size) 1. Jumlah node-node tersebut tidak dijelaskan dalam informasi
yang diberikan. Sementara itu, titik pada nilai 16 menunjukkan bahwa ada node-node
dalam jaringan dengan ukuran (size) 16. Jumlah node-node ini juga tidak dijelaskan.

Informasi ini memberikan gambaran tentang struktur dan sifat jaringan. Komponen
terhubung lemah menunjukkan bahwa ada beberapa kelompok simpul yang saling
terhubung tetapi mungkin tidak ada jalur langsung antara setiap pasangan simpul.
Sementara itu, komponen terhubung kuat menunjukkan adanya kelompok simpul yang
sangat terkait satu sama lain dan setiap simpul dapat dicapai dari setiap simpul lain
dalam kelompok melalui jalur yang mengikuti arah koneksi.

Distribusi ukuran (size) simpul menunjukkan variasi ukuran dalam jaringan. Titik pada
nilai 1 dan 16 mengindikasikan adanya node-node dengan ukuran yang spesifik, tetapi
informasi tentang jumlah simpul dalam ukuran tersebut tidak diberikan.
Pada grafik diatas modularity 0.287, modularity with resolution 0.287 dan communities 59

1. Modularity (Modularitas): Nilai modularity 0.287 menunjukkan sejauh mana jaringan


dapat dibagi menjadi komunitas-komunitas yang lebih padat secara internal daripada
dengan node-node di luar komunitas. Nilai modularity berkisar antara -1 hingga 1,
dengan nilai yang lebih tinggi menunjukkan tingkat modularitas yang lebih baik. Dalam
kasus ini, nilai modularity sebesar 0.287 menunjukkan adanya struktur modular dalam
jaringan, di mana node-node cenderung terhubung lebih erat dalam komunitas-
komunitas daripada dengan node-node di luar komunitas. Namun, perlu dicatat bahwa
penilaian lebih lanjut terkait dengan konteks dan ukuran jaringan diperlukan untuk
menafsirkan secara tepat nilai modularity ini.

2. Modularity with Resolution (Modularitas dengan Resolusi): Nilai modularity with


resolution 0.287 mengacu pada metode atau pendekatan tertentu yang digunakan
dalam menghitung modularitas jaringan dengan mempertimbangkan resolusi atau
tingkat detail dalam pengelompokan komunitas. Metode ini memungkinkan
penyesuaian resolusi yang lebih halus dalam identifikasi komunitas-komunitas dalam
jaringan. Dalam hal ini, nilai modularity with resolution yang sama dengan nilai
modularity biasa (0.287) menunjukkan bahwa resolusi yang digunakan dalam analisis
tersebut tidak menghasilkan perubahan signifikan dalam hasil modularitas.
3. Communities (Komunitas): Terdapat 59 komunitas dalam jaringan. Ini menunjukkan
bahwa jaringan dapat dibagi menjadi 59 kelompok yang lebih kecil berdasarkan pola
koneksi antara node-node. Setiap komunitas tersebut memiliki node-node yang lebih
terhubung secara erat satu sama lain dalam komunitas tersebut dibandingkan dengan
node-node di luar komunitas. Komunitas-komunitas ini dapat memberikan wawasan
tentang struktur dan hubungan dalam jaringan serta pola interaksi antara node-node
yang terlibat.

Anda mungkin juga menyukai