2016 4156358.en - Id
2016 4156358.en - Id
com
Artikel Penelitian
Teknik Pengumpulan Data untuk Jaringan Sensor Nirkabel:
Perbandingan
Departemen Teknik, Universitas Messina, Contrada Di Dio, Sant'Agata, 98166 Messina, Italia
Hak Cipta © 2016 Giuseppe Campobello dkk. Ini adalah artikel akses terbuka yang didistribusikan di bawah Lisensi Atribusi Creative
Commons, yang mengizinkan penggunaan, distribusi, dan reproduksi tanpa batas dalam media apa pun, asalkan karya aslinya dikutip
dengan benar.
Kami mempelajari masalah pengumpulan data dalam jaringan sensor nirkabel dan membandingkan beberapa pendekatan yang termasuk dalam
bidang penelitian yang berbeda; khususnya, pemrosesan sinyal, penginderaan tekan, teori informasi, dan teknik pengumpulan data terkait jaringan
diselidiki. Secara khusus, kami memperoleh model analitik sederhana yang dapat memprediksi efisiensi energi dan keandalan berbagai teknik
pengumpulan data. Selain itu, kami melakukan simulasi untuk memvalidasi model kami dan untuk membandingkan efektivitas skema di atas dengan
secara sistematis mengambil sampel ruang parameter (yaitu, jumlah node, jangkauan transmisi, dan sparitas). Hasil simulasi dan analisis kami
menunjukkan bahwa tidak ada teknik pengumpulan data terbaik untuk semua aplikasi yang mungkin dan bahwa pertukaran antara konsumsi energi
dan keandalan dapat mendorong pilihan teknik pengumpulan data yang akan digunakan. Dalam konteks ini, model kami bisa menjadi alat yang
berguna.
dalam makalah ini). Secara khusus, kami memperoleh model analitik trade-off yang berbeda antara keandalan dan penghematan energi.
sederhana yang dapat memprediksi efisiensi energi dan keandalan Akhirnya, dalam [17], penulis membahas masalah memaksimalkan masa
beberapa teknik pengumpulan data. Selain itu, kami melakukan pakai jaringan dengan mempertimbangkan juga latensi dan keandalan.
simulasi untuk memvalidasi model kami dan untuk membandingkan
efektivitas skema di atas dengan secara sistematis mengambil Namun, dengan pengecualian [15], makalah di atas tidak
sampel ruang parameter (yaitu, jumlah node, jangkauan transmisi, melakukan agregasi data apa pun dengan tujuan tidak
dan sparitas). menimbulkan penundaan tambahan.
Sisa makalah ini disusun sebagai berikut. Di Bagian 2, kami
Seperti yang ditunjukkan pada [18-21], dengan menggabungkan agregasi
menyajikan ringkasan karya terkait. Di Bagian 3, rincian lebih lanjut
data dan mekanisme perutean, skema pengumpulan data yang efisien dapat
tentang teknik pengumpulan data yang ada diberikan dengan
diperoleh.
menyoroti kelebihan dan kekurangannya. Di Bagian 4, skenario
Secara khusus dalam [18], masalah routing yang dioptimalkan
simulasi yang digunakan untuk perbandingan dirinci dan model
bersama dan agregasi data diselidiki; di [19], penulis
analitis yang dapat memprediksi efisiensi energi dan keandalan dari
menggabungkan kompresi data dan teknik perutean multipath
berbagai teknik pengumpulan data diturunkan. Di Bagian 5, metrik
untuk mendapatkan skema agregasi data yang andal dan latensi
yang digunakan untuk membandingkan teknik pengumpulan data
rendah; di [20], skema pengumpulan dan pengumpulan data yang
diperkenalkan. Pada Bagian 6, hasil simulasi disediakan dan model
seimbang energi diusulkan yang mengintegrasikan struktur hierarki
analitik yang dikembangkan divalidasi. Akhirnya, di Bagian 7,
pengelompokan dengan penginderaan tekan untuk
beberapa komentar penutup dan pekerjaan masa depan digambar.
mengoptimalkan dan menyeimbangkan jumlah data yang
ditransmisikan; akhirnya di [21] teknik pengumpulan data
Demi kejelasan, simbol dan notasi yang digunakan di
berdasarkan paradigma pengkodean jaringan diusulkan.
seluruh makalah dilaporkan di bagian Notasi.
Rincian lebih lanjut tentang karya-karya di atas akan diberikan di
Bagian 3.4.
2. Pekerjaan Terkait
Beberapa makalah lain ada yang membandingkan teknik
Dalam beberapa tahun terakhir, beberapa teknik pengumpulan data pemrosesan sinyal di WSN dari efisiensi energi dan perspektif masa
telah diusulkan untuk WSN dengan tujuan utama mengurangi pakai jaringan dan beberapa karya menyoroti efek penggunaan
konsumsi energi di WSN dengan memanfaatkan korelasi antara mekanisme perutean yang berbeda untuk pengumpulan data.
data sensorik. Kita dapat membedakannya menjadi dua kategori Namun demikian, teknik milik bidang penelitian yang
besar: berorientasi kompresi dan berorientasi jaringan. berbeda seperti penginderaan tekan, teori informasi, dan
Kategori pertama, bernama berorientasi kompresi, difokuskan jaringan jarang dievaluasi satu sama lain dan ini adalah
untuk memaksimalkan masa pakai jaringan dengan memanfaatkan tujuan utama dari makalah ini.
teknik kompresi data [3-10]. Secara khusus, [3, 4] menganalisis Baru-baru ini, perbandingan tersebut telah dimulai, misalnya,
skema kompresi lossless yang berbeda untuk WSN yang [22] di mana teknik agregasi data lossy dievaluasi dan dibandingkan
mengeksploitasi korelasi temporal dalam sinyal sampel; dalam [5, dalam hal kesalahan rekonstruksi dan konsumsi energi. Namun,
6], penulis memanfaatkan korelasi spasial dengan menggunakan penulis tidak mempertimbangkan dampak dari keandalan jaringan
teknik pengkodean sumber terdistribusi berdasarkan teorema (yaitu, kehilangan paket) atau membandingkan teknik pengumpulan
Slepian-Wolf; akhirnya, [7-10] menyelidiki batas mendasar dari data berbasis jaringan seperti yang didasarkan pada paradigma
teknik pengumpulan data berdasarkan paradigma baru pengkodean jaringan.
penginderaan tekan [11, 12]. Sebuah tinjauan komprehensif
Tujuan dari makalah ini adalah untuk mengisi kesenjangan ini
pendekatan kompresi data yang ada di WSNs disediakan di [13].
dengan menyelidiki efektivitas semua teknik pengumpulan data di atas
Rincian lebih lanjut tentang teknik pengumpulan data
juga dalam hal keandalan. Secara khusus, model analitik yang dapat
berorientasi kompresi akan diberikan di Bagian 3. Secara
memprediksi efisiensi energi dan keandalan dari berbagai teknik
khusus, pemrosesan sinyal, penginderaan tekan, dan teknik
pengumpulan data diturunkan.
terkait teori informasi dibahas, masing-masing, di Bagian 3.1,
3.2, dan 3.3.
Karena transmisi radio adalah sumber utama konsumsi 3. Teknik Pengumpulan Data
daya di WSN, kategori kedua dari teknik pengumpulan data,
Kita dapat mengklasifikasikan skema pengumpulan data berdasarkan
bernama berorientasi jaringan, telah menangani masalah
bidang penelitian dari mana teknik yang digunakan untuk
memaksimalkan masa pakai jaringan dengan
mengeksploitasi korelasi antara node sensor diambil, yaitu,
mempertimbangkan protokol jaringan dan, lebih khusus lagi,
mekanisme penerusan/perutean [14-17]. (i) pemrosesan sinyal;
Secara khusus, dalam [14], penulis menunjukkan bagaimana
(ii) penginderaan tekan;
mungkin untuk memaksimalkan masa pakai WSN dengan
mengeksploitasi algoritma perutean. Dalam [15], penulis mempelajari (iii) teori informasi;
masalah konstruksi hutan untuk memaksimalkan masa pakai jaringan (iv) jaringan.
dan mengadopsi model agregasi data sederhana di mana sensor
perantara dapat menggabungkan beberapa pesan masuk menjadi satu Teknik-teknik yang termasuk dalam bidang-bidang di atas dibahas
pesan keluar. Pendekatan yang berbeda diusulkan dalam [16] di mana dalam subbagian berikutnya dengan menyoroti kelebihan dan
teknik pemisahan cerdas digunakan untuk mencapai kekurangannya.
Jurnal Internasional Jaringan Sensor Terdistribusi 3
3.1. Teknik Pemrosesan Sinyal.Sering ada korelasi tinggi (spasial oleh karena itu rasio kompresi yang tinggi dapat dicapai dengan
dan/atau temporal) di antara pembacaan sensor. Dalam hal ini, menggunakan CS (yaitu, dengan mentransmisikan pengukuran CS alih-alih
tidak efisien untuk mengirimkan seluruh data mentah ke tujuan data mentah ).
[8, 9] dan pemrosesan sinyal, khususnya teknik Transforms and Rekonstruksi dicapai dengan memecahkan masalah
Encoding Compression (TEC), dapat dimanfaatkan untuk optimasi kompleks dari bentuk berikut:
mengurangi jumlah data yang akan dikirim.
Dalam kasus teknik TEC lokal, node mengumpulkan argmin kan1
(1)
pengukuran mengikuti teorema pengambilan sampel Shannon-
st =,
Nyquist; pengukuran ini ditransformasikan dan dikodekan
dengan benar dan output dari transformasi tersebut disimpan di mana = . Setelah masalah di atas terpecahkan, dapat
dalam muatan satu atau lebih paket dan dikirim ke sink. Secara dipulihkan sebagai = . Sebagai alternatif, ketika langkah-langkah
khusus, teknik lossy atau lossless dapat digunakan tergantung bersuara dipertimbangkan, masalah optimasi berikut dapat
pada skenario aplikasi tertentu. dipertimbangkan:
Dengan teknik lossy [3], data asli dikompres dengan membuang
beberapa informasi asli; ini memungkinkan pencapaian rasio
argmin kan1
kompresi yang lebih tinggi tetapi di sisi penerima hanya dapat
(2)
st - α 2
2,
merekonstruksi data dengan akurasi tertentu.
Namun, dalam beberapa jenis pemantauan, keakuratan di mana ε membatasi kebisingan.
pengamatan sangat penting untuk memahami proses fisik yang Ada beberapa algoritma yang mampu memecahkan
mendasarinya. Dalam kasus lain, tidak mungkin untuk memiliki masalah optimasi di atas (Basis Pursuit [25], OMP [26], dan
pengetahuan apriori tentang besarnya kesalahan pengamatan yang CoSaMP [27], untuk menyebutkan beberapa saja) dan beberapa
dapat ditoleransi tanpa mempengaruhi pengumpulan data yang hasil teoretis ada yang menjelaskan kapan algoritma ini
benar. Selain itu, beberapa domain aplikasi (misalnya, BAN jaringan memulihkan solusi sparse. Khususnya,
area tubuh di mana node sensor secara permanen memantau dan
mencatat tanda-tanda vital) menuntut sensor dengan akurasi tinggi (i) sebagaimana dibuktikan dalam [28], sebuah sinyal dapat dipulihkan
dan tidak dapat mentolerir pengukuran yang rusak oleh proses dengan probabilitas tinggi jika memenuhi Restricted Isometric
kompresi lossy. Property (RIP).
Dalam semua jenis WSN ini, pengumpulan data lossless Secara formal, amatrixΦmemenuhi RIP jika untuk semua -
sangat penting dan diinginkan. Contoh skema kompresi sinyal jarang ada δ (0, 1) seperti yang
lossless lokal telah diusulkan di [4, 23, 24].
Teknik kompresi lossy telah dievaluasi dan dibandingkan (1 )2 2 i2 2 (1 + )2 2. (3)
dalam hal kesalahan rekonstruksi dan konsumsi energi di [22];
oleh karena itu, dalam makalah ini kami memusatkan perhatian Contoh matriks yang memenuhi kondisi RIP adalah ±1
kami pada teknik lossless. Matriks Bernoulli dan matriks distribusi Gaussian
Demi ruang, kami tidak mempertimbangkan teknik TEC di mana φ, (0,2 Φ) dengan σ2Φ = 1/ .
terdistribusi dalam makalah ini tetapi kami merujuk pembaca ke
(ii) Seperti yang dibuktikan pada [29], dalam kasus bebas noise,
[13]. Namun demikian, pendekatan terdistribusi utama dari
pemulihan eksak dengan matriks Gaussian dapat diperoleh jika
pemrosesan sinyal yang diterapkan pada WSN akan dibahas dalam
subbagian berikutnya. 5
=* = 2 catatan ( ) + + 1. (4)
4
3.2. Penginderaan Kompresi.Penginderaan kompresif (CS) adalah paradigma
baru yang diperkenalkan oleh Candes dan Tao [11] dan Donoho [12] yang Kami akan mengeksploitasi hasil di atas untuk mendapatkan model
digunakan untuk menangkap dan mengompresi sinyal di WSN di mana keandalan untuk CS.
kompresi dan pengambilan sampel digabungkan dan dilakukan pada saat CS dapat diterapkan dalam WSN berbasis cluster mengingat setiap
yang bersamaan. Pada dasarnya, CS mengompresi sinyal saat memperoleh node sensor dalam sebuah cluster mengirimkan bacaannya ke kepala
data pada tingkat informasinya (tanpa bergantung pada teorema pengambilan cluster yang akan mengalikan semua pembacaan yang diterima dengan
sampel Shannon-Nyquist). Teori CS menyatakan bahwa jika suatu sinyal jarang koefisien acak φ, dengan menghasilkan jumlah tertimbang = Σ φ,
atau dapat dimampatkan dalam basis tertentu, maka sinyal tersebut dapat dengan [1, . . . , ].Selanjutnya, nilai , bernama pengukuran CS,
direkonstruksi dari sejumlah kecil pengukuran linier dengan menyelesaikan dikirim ke sink melalui satu atau beberapa paket.
suatu 1 berbasis masalah optimasi cembung [7]. Berdasarkan teori CS, dalam kondisi sparity, dengan
Lebih tepatnya, mari kita definisikan -sinyal jarang = (1, . . . , mengumpulkan jumlah pengukuran CS yang cukup, sink
) sebagai sinyal yang dapat dinyatakan sebagai = , di mana adalah akan dapat merekonstruksi data sensor asli. .
transformasi ortonormal dan α adalah vektor dengan paling banyak CS dapat diterapkan juga di WSN berbasis pohon mengingat node
« entri bukan nol; Teori CS menyatakan bahwa dapat dipulihkan sumber termasuk dalam paketnya informasi penginderaan yang
dari = ( catatan(/ )) kombinasi linear dari pengukuran yang merupakan produk dari nilai yang diperoleh dan koefisien acak dan
diperoleh sebagai = , dimana adalah × matriks. kemudian mengirimkannya ke node hop berikutnya [30]. Dengan cara
Perhatikan bahwa, mengingat bahwa adalah nilai yang kecil demikian, kompresi CS dapat dilakukan dengan kompleksitas yang
dibandingkan dengan , berikut ini bisa jauh lebih kecil dari dan rendah pada node sumber [9] dan lalu lintas data melalui
4 Jurnal Internasional Jaringan Sensor Terdistribusi
jaringan berkurang [8]. Namun, dalam kasus terakhir jumlah hop data kemudian dikompresi dengan kode yang mengidentifikasi bin
yang tinggi diperlukan, yaitu,= ( / ), yang dapat menyebabkan latensi unik tempat nilai sampel berada.
jaringan yang tinggi. Untuk lebih menjelaskan cara kerja DISCUS, mari kita perhatikan
Dalam [7], perbandingan teknik pemrosesan sinyal berbasis contoh sederhana.
CS dan konvensional untuk WSN telah dilakukan dalam hal Mari kita anggap bahwa pengukuran (terkuantisasi) berada dalam
efisiensi energi dan masa pakai jaringan. kisaran bilangan bulat [0, 7] dan bahwa semua data yang dirasakan dari
Namun, ada beberapa tantangan yang harus diatasi sensor yang berbeda pada (hampir) waktu yang sama paling banyak
untuk menggunakan CS: berbeda ±1. Tanpa kompresi DSC, tiga bit diperlukan untuk setiap sensor
untuk mewakili data sensorik. Sebaliknya, dalam kasus DSC hanya kepala
(i) Waktu decoding untuk rekonstruksi dapat menjadi ( 3) dan karena
cluster yang mengirimkan nilai tiga bit. Node sensor lainnya dapat
itu sangat mahal untuk jaringan besar. Ada algoritma yang lebih
membagi nilai yang mungkin menjadi empat tempat sampah {0, 4}; {1,
murah (misalnya, pencocokan pencarian) tetapi mereka
5}; {2, 6}; {3, 7}sehingga nilai dalam bin yang sama memiliki jarak
memberikan pemulihan yang kurang stabil dan batas kesalahan
minimum = 4 dan mengkodekannya, masing-masing, dengan {00}, {01},
yang lebih lemah dalam solusi yang dipulihkan.
{10}, {11}. Jadi jika sink menerima 01 dari node sensor, ia mengetahui
(ii) CS mengasumsikan bahwa data yang diindra memiliki sparitas bahwa hanya dua nilai yang mungkin, yaitu {1, 5}. Sekarang mari kita
konstan yang diketahui, mengabaikan bahwa sparitas sinyal anggap bahwa wastafel juga menerima nilai 6 (dikodekan dengan benar)
nyata bervariasi dalam domain temporal dan spasial. Secara dari kepala cluster; dalam hal ini, nilai 01 segera diinterpretasikan
khusus, dasar sparsifying diasumsikan diberikan dan diperbaiki sebagai 5 tanpa ambiguitas sebagai konsekuensi dari fakta bahwa data
dengan waktu, tetapi ini tidak berlaku untuk skenario WSN yang yang diindra dapat berbeda paling banyak 1.
realistis, di mana sinyal yang diinginkan tidak diketahui dan
karakteristik statistiknya dapat bervariasi dari waktu ke waktu.
Dalam contoh di atas, hanya kepala cluster yang mentransmisikan 3
bit untuk setiap pengukuran sedangkan untuk semua node lainnya
(iii) Teknik berbasis CS menimbulkan kerugian yang tidak dapat diabaikan cukup 2 bit; oleh karena itu, kompresi tercapai.
(kesalahan pemulihan) dengan mengurangi keandalan dan bekerja Namun, DSC bergantung pada asumsi bahwa karakteristik
paling baik untuk jaringan skala besar (setidaknya seribu node). statistik (yaitu, fungsi korelasi) dari data yang mendasarinya harus
(iv) Efek kuantisasi: Teori CS sebagian besar berfokus diketahui secara apriori, yang sulit diperoleh dalam skenario praktis.
pada pengukuran bernilai nyata tetapi dalam Misalnya, skema DISCUS sederhana yang dibahas di atas hanya
praktiknya pengukuran harus direpresentasikan berfungsi jika perbedaan antara nilai sampel oleh kepala cluster dan
dengan jumlah bit yang terbatas. Akibatnya, ada semua node lain dalam cluster yang sama kurang dari/2. Selain itu,
trade-off antara jumlah pengukuran dan jumlah bit kehilangan informasi sampingan (yaitu, data kepala cluster) akan
per pengukuran CS. menyebabkan kesalahan fatal pada dekoder, yaitu keandalan yang
rendah.
Dalam makalah ini, kami berkonsentrasi pada dua masalah terakhir, Cara sederhana untuk meningkatkan keandalan dicapai dengan
dengan menganalisis pengaruh sparsity dan kuantisasi pada penghematan mentransmisi ulang paket kepala klaster lebih banyak tetapi ini
energi dan keandalan. Rincian lebih lanjut tentang CS dan cara mengurangi efisiensi kompresi. Oleh karena itu, ada trade-off
mengeksploitasinya untuk WSN akan diberikan di bagian selanjutnya. antara konsumsi energi dan keandalan berdasarkan jumlah
transmisi ulang maksimum yang diizinkan. Dalam makalah ini, kami
3.3. Teknik Terkait Teori Informasi.Untuk mengeksploitasi menyelidiki pertukaran semacam itu.
korelasi data yang diperoleh secara bersamaan oleh sensor
yang berbeda, teknik DSC, yang terinspirasi oleh teorema 3.4. Teknik Jaringan
Slepian-Wolf, dapat diterapkan [2]. Teknik DSC menyiratkan
bahwa setiap node sensor mengirimkan output terkompresi ke 3.4.1. Teknik Berbasis Perutean.Karena transmisi radio adalah
sink untuk decoding bersama. Ini berarti bahwa node perlu sumber utama konsumsi daya di node, desain perutean hemat
bekerja sama dalam kelompok dua atau tiga sehingga satu energi adalah topik penting lainnya untuk diselidiki dalam
node menyediakan informasi samping dan yang lain dapat desain teknik pengumpulan data. Ide dasarnya adalah untuk
memampatkan informasinya ke batas Slepian-Wolf atau Wyner- merutekan paket melalui jalur sehingga meminimalkan
Ziv. Selanjutnya, pendekatan DSC juga sulit untuk diterapkan konsumsi energi secara keseluruhan untuk mengirimkan paket
dalam skenario seperti itu karena mereka bekerja dengan dari sumber ke tujuan. Masalah berfokus pada komputasi aliran
asumsi bahwa karakteristik statistik dari distribusi data yang dan daya transmisi untuk memaksimalkan masa pakai jaringan,
mendasarinya harus diketahui terlebih dahulu [9, 31]. yaitu waktu di mana node pertama dalam jaringan kehabisan
Implementasi DSC yang paling praktis dan terkenal adalah DISCUS energi [18]. Secara khusus, tingkat konsumsi energi per unit
[5, 32] di mana node sensor dianggap dibagi menjadi beberapa cluster. transmisi informasi untuk setiap node tergantung pada pilihan
Untuk setiap cluster, sebuah node (kepala cluster) mengirimkan data hop berikutnya, yaitu keputusan routing. Pilihan ini dapat
yang tidak terkompresi (sebagai informasi sampingan) sementara semua mempengaruhi energi yang dibutuhkan untuk mencapai sink
node lainnya mengirimkan data yang dikodekan (yaitu, dikompresi). [14].
Untuk mengkodekan data, node sensor terlebih dahulu membagi semua nilai Salah satu karya terbaru yang membahas masalah memaksimalkan
yang mungkin menjadi himpunan yang terpisah-pisah (bernama bin) sehingga nilai masa pakai jaringan dengan mempertimbangkan mekanisme perutean
dalam bin yang sama memiliki jarak minimum. . Setiap bagian dari sensorik adalah [17]. Penulis mencoba untuk mencapai keduanya
Jurnal Internasional Jaringan Sensor Terdistribusi 5
latensi rendah dan keandalan tinggi. Mereka membangun pohon memiliki kemampuan untuk meneruskan fungsi paket yang diterima
pengumpulan data berdasarkan model keandalan, menjadwalkan (misalnya, kombinasi linier). Dengan cara ini, keuntungan throughput,
transmisi data untuk tautan di pohon, dan menetapkan daya transmisi ke ketahanan, dan penghematan energi dapat dicapai dengan
setiap tautan yang sesuai. Namun, mereka tidak melakukan segala jenis memanfaatkan fakta bahwa setiap paket yang baru dihasilkan membawa
agregasi data atau kompresi data dengan tujuan tidak menimbulkan informasi yang terkandung dalam beberapa paket asli [39].
penundaan ekstra. NC telah mendapat perhatian yang meningkat juga di WSN sebagai
Agregasi data dapat dilakukan di atas algoritma perutean. alat yang menjanjikan untuk meningkatkan masa pakai dan keandalan
Fungsi agregasi biasanya dilakukan dengan mengekstrak jaringan dengan memanfaatkan sifat siaran saluran nirkabel [40].
beberapa nilai statistik (misalnya, maksimum, minimum, dan Namun, sebagian besar teknik yang diusulkan dikembangkan sejauh
rata-rata) dan kemudian hanya mentransmisikan ini [15]. ini [41-43], sementara berguna untuk penyebaran data (misalnya, lalu
Sedemikian rupa, dimungkinkan untuk mengurangi jumlah
lintas dari node sink ke node sensor), tidak dapat diterapkan untuk
komunikasi data dalam jaringan sensor padat dan mengurangi
pengumpulan data, yang merupakan lalu lintas terpenting di WSN. .
konsumsi daya. Namun, teknik ini kehilangan banyak struktur
data asli yang diperoleh.
Bahkan, untuk menerapkan NC untuk pengumpulan data di WSN, beberapa
Secara khusus, penulis [15] mempelajari masalah konstruksi
masalah harus diselesaikan.
hutan untuk memaksimalkan masa pakai jaringan. Mereka
mengadopsi model agregasi data sederhana dan mengasumsikan
(i) Header Overhead. Skema NC sebagian besar didasarkan
bahwa sensor perantara dapat menggabungkan beberapa pesan
pada kode linier acak [44, 45] yang memungkinkan
Bbit yang masuk, bersama dengan pesannya sendiri, menjadi satu
penerapannya secara terdistribusi tetapi memperkenalkan
pesan keluar. Selain itu, mereka menyediakan algoritma waktu
overhead yang besar karena koefisien yang digunakan untuk
polinomial untuk membangun pohon dan menunjukkan bahwa itu
kombinasi linier harus ditentukan dalam header paket. Ukuran
mendekati optimal.
header sebanding dengan jumlah paket agregat yang, dalam
Dalam [14, 33, 34], penulis mempertimbangkan masalah
kasus khusus pengumpulan data di WSN, bisa sama dengan
memaksimalkan masa pakai WSN dengan algoritma perutean dengan
jumlah node dalam jaringan.
menyusun kembali masalah ini sebagai masalah pemrograman linier
yang dapat diselesaikan dalam waktu polinomial. Algoritme yang (ii) Masalah Semua-atau-Tidak Sama sekali. Kapan paket digabungkan
diusulkan adalah rute jalur biaya terpendek yang biaya tautannya menggunakan NC, wastafel harus menerima setidaknya paket agar
merupakan kombinasi dari konsumsi energi transmisi dan penerimaan dapat memulihkan informasi asli. Jadi, bahkan jika wastafel menerima1
dan tingkat energi sisa pada dua simpul akhir. paket, itu tidak dapat memulihkan informasi apa pun. Sebaliknya,
Dalam [18], penulis mencoba untuk bersama-sama degradasi anggun diinginkan di WSN.
mengoptimalkan perutean dan agregasi data sehingga masa pakai
jaringan dapat diperpanjang dengan mempertimbangkan dua (iii) Keterlambatan. Penundaan yang diperkenalkan oleh NC mungkin
dimensi. Pada dimensi pertama, lalu lintas di seluruh jaringan menjadi penghalang untuk jaringan besar di mana sejumlah besar paket
dikurangi dengan agregasi data, sehingga dapat mengurangi harus digabungkan dan diterjemahkan. Sebaliknya, banyak aplikasi
konsumsi daya dari node yang dekat dengan node sink. Di dimensi jaringan sensor, misalnya, WSN yang dikembangkan untuk kontrol/
kedua, lalu lintas seimbang untuk menghindari node bottleneck otomatisasi atau streaming audio/video real-time, memerlukan
yang berlebihan. Fungsi smoothing digunakan untuk mendekati penundaan terbatas yang kecil.
fungsi maksimalisasi asli dengan mengeksploitasi struktur khusus
jaringan. Kondisi yang diperlukan dan cukup untuk mencapai (iv) Bersepeda Tugas. Sebagian besar skema NC didasarkan pada
optimalitas fungsi pemulusan ini diturunkan dan algoritma gradien pendengaran; yaitu, node harus tetap dalam mode aktif untuk
terdistribusi dirancang dengan tepat. berpartisipasi dalam perutean berbasis NC, yang meningkatkan
Yang dkk. mengusulkan dalam [35-37] desain bersama pengisian konsumsi energi node sensor. Jadi, sulit untuk menggabungkan
energi dan pengumpulan data dengan memanfaatkan mobilitas. SenCar, paradigma NC dan teknik duty-cycling yang biasa digunakan di
entitas seluler multifungsi, secara berkala memilih subset sensor untuk WSN.
dikunjungi berdasarkan status energinya. Ini menggunakan transmisi
(v) Keandalan. Keandalan penuh (atau setidaknya tinggi) diinginkan
energi nirkabel untuk mengirimkan energi ke sensor yang dikunjungi
dalam jaringan sensor dan wajib dalam beberapa skenario,
dan, sementara itu, mengumpulkan data dari sensor terdekat melalui
misalnya, dalam eksperimen ilmiah baru, di mana akurasi
komunikasi multihop jarak pendek dan dapat menyampaikan data ini ke
pengamatan sangat penting, atau dalam kasus aplikasi biomedis, di
sink.
mana perlu untuk memastikan bahwa rincian penting tidak hilang
menyebabkan kesalahan dalam diagnosis medis. Ketika kode acak
3.4.2. Teknik Berbasis Pengkodean Jaringan.Pendekatan yang
digunakan, bahkan dalam jaringan yang andal, pesan asli dapat
berbeda mengeksploitasi paradigma network coding (NC).
diambil dengan "probabilitas tinggi" (meskipun bukan "kepastian"),
NC adalah pendekatan transmisi informasi yang efektif yang dan probabilitas tinggi dicapai melalui penggunaan bidang terbatas
awalnya diperkenalkan oleh Ahlswede et al. [38] untuk yang besar (yaitu, koefisien besar dan karenanya header besar).
meningkatkan kapasitas jaringan jaringan multicast.
Berbeda dari paradigma jaringan store and forward klasik di
mana node hanya mereplikasi dan meneruskan paket yang (vi) Kompleksitas. Teknik NC harus sederhana untuk mengatasi
masuk, menggunakan node perantara NC dalam jaringan sumber daya komputasi dan memori node sensor yang rendah.
6 Jurnal Internasional Jaringan Sensor Terdistribusi
Kami merujuk pembaca ke [46] untuk pertimbangan lebih lanjut 4.1. Model Jaringan.Kami mengasumsikan WSN di mana
tentang penerapan NC ke WSN. wastafel terletak di tengah area ukuran persegi penginderaan ×
Masalah di atas telah dipecahkan di [16] di mana penulis [M2] dan node sensor didistribusikan secara acak dengan
mengusulkan teknik penerusan baru untuk WSN kepadatan [node/m2]. Setiap node sensor memiliki jangkauan
berdasarkan Teorema Sisa Cina (CRT) yang mampu transmisi yang sama dengan[m] (dengan /2) dan mengirimkan
mencapai pertukaran yang berbeda antara keandalan dan datanya ke sink melalui skema multihop.
penghematan energi. Jaringan dipartisi menjadi cluster yang tidak tumpang tindih
Pada dasarnya, CRT dapat dilihat sebagai teknik pemisahan menggunakan prosedur yang dijelaskan dalam [16, 49]. Prosedur yang
yang dapat mengubah bilangan bulat ke dalam vektor bilangan disebutkan di atas terutama didasarkan pada pertukaran Pesan
yang lebih kecil bernama komponen CRT, { }. Komponen CRT Inisialisasi (IM) dan memungkinkan pengorganisasian jaringan dalam
diperoleh dari nomor menggunakan aritmatika modular sebagai = kelompok meminimalkan jumlah hop yang dibutuhkan oleh node sensor
(mod ), di mana (dengan [1, . . . ,CRT]) adalah bilangan prima (atau untuk mencapai sink. Wastafel seharusnya milik cluster 1 (dilambangkan
setidaknya bilangan bulat coprime berpasangan). sebagai CL1) dan menghasilkan IM pertama dengan alamatnya sendiri
dan nomor urut SN = 2. Setiap node, yang menerima IM dari
CRT menyatakan bahwa setiap bilangan bulat dapat diperoleh
tetangganya dengan nomor urut SN = , akan menjadi milik cluster CLℎ
kembali secara tepat dari komponen CRT-nya jika produk dari prime
dan akan mengirim ulang IM dengan nilai SN yang meningkat bersama
angka = CRT =1 memenuhi syarat
dengan alamatnya sendiri dan
(5) daftar node yang akan digunakan sebagai forwarder (yang diketahui sesuai
>
dengan alamat sumber yang ditentukan dalam IM yang diterima).
(selanjutnya dinamakan kondisi rekonstruksi). Secara khusus, Berdasarkan IM yang diterima, pada akhir prosedur di atas, setiap node
CRT selalu menyatakan bahwa dapat dipulihkan melalui dalam jaringan akan mengetahui hop berikutnya sendiri dan node lain
kombinasi linier sederhana sebagai mana yang akan menggunakannya sebagai hop berikutnya. Rincian lebih
lanjut tentang prosedur inisialisasi adalah
CRT
tepi jam dari unit pengambilan sampel atau, lebih praktis, ketika Jadi mengingat itu node merasakan peristiwa tersebut, jumlah keseluruhan bit
jumlah pengukuran yang cukup telah dikumpulkan dan paket siap yang ditransmisikan untuk setiap peristiwa ketika DSC digunakan adalah
untuk ditransmisikan.
Mempertimbangkan abstraksi di atas, konsumsi energi dan
keandalan jaringan dapat dievaluasi dalam hal jumlah peristiwa (yaitu, DSC = ,DSC+ ( - 1) . (8)
paket yang dikirim) dengan tidak memperhitungkan siapa yang DSC
mendorong peristiwa tersebut.
(iii) CS. Kami berasumsi bahwa header sel mengumpulkan paket dari
Oleh karena itu, dalam skenario simulasi kami, kami akan
node lain di sel yang sama dan mengirimkannya dengan
mempertimbangkan bahwa V peristiwa secara acak terjadi di jaringan
menerapkan CS. Lebih tepatnya, langkah-langkah yang
sensor dan bahwa, untuk setiap peristiwa, node mengenali acara dan
dikumpulkan dapat diwakili oleh matriksx dari × nilai-nilai dari -bit
menghasilkan paket. Lebih tepatnya, kami berasumsi bahwa hanya
masing-masing di mana kolom ke- x mewakili langkah-langkah
simpul di dalam area lingkaran jari-jari, dengan pusat di lokasi acara,
yang diambil oleh node hampir bersamaan. Mempertimbangkan
mendeteksi acara dan karena itu perlu mengirim paket. Selanjutnya,
bahwa nilai-nilai tersebut sangat berkorelasi baik dalam ruang dan
kami menyebut area melingkar yang terkait dengan suatu peristiwa
waktu dengan mengambil transformasi yang tepat, kami
sebagai sel.
memperoleh vektor jarang dengan probabilitas tinggi. Misalnya, kita
Dalam jaringan yang digerakkan oleh peristiwa, biasanya paket-paket
dapat mengasumsikan bahwa DCT diterapkan pada setiap vektor
kecil dikirim untuk menentukan bahwa suatu peristiwa telah terdeteksi (satu -
kolomx dan hanya itu Koefisien DCT akan menjadi bukan nol.
sedikit kata bisa cukup dalam banyak kasus). Alih-alih dalam kasus jaringan
Dalam hal ini kepala sel perlu mengirim= ( catatan( / )) pengukuran
berbasis waktu atau berbasis kueri, paket mewakili langkah-langkah yang
untuk setiap kolom, yaitu, ⋅ pengukuran untuk setiap kejadian.
dikumpulkan dalam interval waktu antara dua peristiwa. Kedua kasus dapat
diperhitungkan mengingat bahwa untuk setiap peristiwa informasi mentah Untuk tujuan simulasi, kami menganggap bahwa
dari bit harus dikirim untuk setiap node dengan memperbaiki = 1 untuk pengukuran CS diwakili oleh CS bit dan pengukuran tersebut
jaringan yang digerakkan oleh peristiwa dan 1 dalam kasus jaringan berbasis dikirim melalui paket dari CS = ⋅ CS bit masing-masing
waktu atau berbasis kueri. melalui skema jalur terpendek penyeimbang beban.
Dengan tujuan mengurangi konsumsi energi (yaitu, jumlah Jadi jumlah keseluruhan bit yang ditransmisikan oleh kepala sel untuk
keseluruhan bit yang dikirim), data mentah tidak langsung setiap kejadian saat CS digunakan adalah
ditransmisikan; sebaliknya, data diproses sesuai dengan teknik
pengumpulan data yang dipilih. CS = CS = CS. (9)
Lebih tepatnya, kami memiliki yang berikut ini.
Pilihan lain dimungkinkan tanpa mengubah jumlah keseluruhan
(i) TEC. Node yang menggunakan teknik TEC memanfaatkan korelasi bit yang ditransmisikan CS; misalnya, kita bisa mempertimbangkan
temporal untuk mengurangi jumlah bit. paket dari ⋅ CS bit, tetapi pilihan sebelumnya akan
Di sini kami tidak mempertimbangkan teknik TEC tertentu tetapi menyederhanakan perbandingan. Secara khusus, kami akan
menganggap bahwa faktor kompresi, TEC, dari teknik TEC yang menunjukkan bahwa dengan hasil perbandingan pilihan di atas
digunakan diketahui. Akibatnya, kita dapat menyatakan bahwa akan independen dari jadi hasil kami akan valid untuk kedua event-
menggunakan teknik TEC setiap bagian dari data mentah-bit akan driven (= 1) dan didorong oleh waktu/permintaan (1) teknik.
direpresentasikan setelah kompresi dengan TEC = / TEC bit dan untuk
setiap peristiwa node harus mentransmisikan TEC = / TEC (iv) CRT. CRT dieksploitasi seperti yang ditunjukkan pada [16].
bit. Jadi mengingat itu node merasakan peristiwa tersebut, jumlah keseluruhan bit Secara khusus, kami menganggap bahwa untuk setiap peristiwa
yang ditransmisikan untuk setiap peristiwa ketika TEC digunakan adalah node sumber mengirim paket mereka ke satu set umum relayer satu hop
bernama Relay CRT. Untuk selanjutnya, kami tunjukkan dengan CRT itu
TEC = TEC = . (7) number of CRT relayers.
TEC
As in the case of CS, the collected measures can be represented
As already stated, we assume that packets are transmitted by a matrix x dari × nilai-nilai dari -bit masing-masing di mana
through a load-balancing shortest-path scheme; that is, a node kolom ke- x represents the measures taken by
in cluster CL+1 akan memilih secara acak node yang dapat nodes almost at the same time.
dijangkau di cluster berikutnya menuju sink (CLℎ), and this CRT relayers process the data of each column x in two
forwarding scheme is repeated until the sink is reached. In this steps:
manner, information reaches the sink with the minimum
number of hops. (1) In the first step, received data are compressed with a
compression algorithm by obtaining a binary
(ii) DSC. According to DISCUS, we assume that only one node sequence .
for each cell (henceforward named the cell head) sends (2) In the second step, CRT is applied to improve
uncompressed measures (i.e., side information) into a reliability by splitting the binary sequence so that
packet of bits while all the other nodes send compressed each CRT relayer forwards a CRT component.
packets of DSC = / DSC bits. Also in this case we assume that
all packets are transmitted through a load-balancing It is worth noting that each CRT relayer will independently
shortestpath scheme. However, to improve reliability we compress the received packets by obtaining the same sequence
assume that the cell head transmits its packets ,DSC times. . This is possible mainly because as they receive the
8 Jurnal Internasional Jaringan Sensor Terdistribusi
same data set and apply the same compression algorithm, the considering 1, . . . , obtained from quantization of continuous
compressed sequence obtained is the same for all relayers. Gaussian variables 1, . . . , , the joint entropy is [51]
Henceforward, we indicate by the length of the
compressed sequence . ( 1, . . . , ) = ℎ ( 1, . . . , )
CRT relayers split the binary sequence they have (11)
1
constructed and forward it. Specifically, the sequence is = log2 (( 2 ) ⋅ |Σ|) ,
2
interpreted as an integer = Σ =0
−1
⋅2 (di mana are bits of
)and by properly choosing the set of prime numbers { } where |Σ|, known as generalized variance, is the determinant of
each CRT relayer calculates and forwards the corresponding the covariance matrix Σ and ℎ(⋅) is the differential entropy
CRT component = (mod ). (rigorously speaking, we have to distinguish between
Note that ⌈log2( )⌉ is the number of bits needed to differential entropy ℎ( ) for a continuous source (i.e., before the
represent , so the overall number of bits transmitted by the A/D conversion) and Shannon’s information entropy ( ) for a
CRT relayers is discrete source (i.e., after quantization introduced by the A/D
conversion); however, it is straightforward to prove that their
CRT values coincide when unitary quantization step is
CRT = ∑ ⌈log2 ( )⌉ . (10) considered, as done in this paper). In particular for Gaussian
=1 sumber dengan koefisien korelasi yang sama ρ dan
varians σ2, varians umum adalah |Σ| =σ2 [1+( −1) ] (1− )1
Dari teori CRT, sink akan dapat merekonstruksi dan oleh karena itu
semua pengukuran mentah dari komponen CRT
asalkan kondisi rekonstruksi puas (yaitu,
Π CRT = catatan2 (2 (1 ) )
=1 2 ).
Perhatikan bahwa kondisi rekonstruksi dapat dipenuhi oleh (12)
1 + ( 1) ) .
beberapa himpunan bilangan prima; namun, untuk mengurangi jumlah + catatan2 (√
bit yang diperlukan untuk merepresentasikan nilai , dan oleh karena itu 1
jumlah keseluruhan bit yang dikirim, lebih disukai untuk memilih
himpunan bilangan prima terkecil, yang kita sebut sebagai Himpunan Selain itu, mengingat bahwa untuk rentang nilai
Prima Minimum (MPS). yang luas (yaitu, ρ [0, 0,99], 8) istilah kedua diabaikan,
Misalnya, jika CRT = 4 dan = 40, MPS akan menjadi {1019, maka
1021, 1031, 1033}. Faktanya, ini adalah himpunan empat
bilangan prima berurutan terkecil yang memenuhi hubungan ≈ catatan2 (2 (1 ) ) . (13)
Π CRT
=1 240.
Oleh karena itu, faktor kompresi lossless ideal (maksimum) untuk
Namun, ketika himpunan bilangan prima dipilih seperti di atas,
variabel Gaussian dengan mempertimbangkan blok nilai berkorelasi
pesan dapat direkonstruksi jika dan hanya jika semua komponen
dari -bit masing-masing dapat diperoleh sebagai
CRT diterima dengan benar oleh sink. Jadi, untuk memperhitungkan
kemungkinan kerugian karena media nirkabel yang tidak dapat ⋅
,ideal = = .
diandalkan, kami menggunakan MPS dengan kegagalan yang dapat (14)
diterima (MPS ), yaitu, himpunan bilangan prima terkecil berturut-
catatan2 (2 (1 ) )
turut yang memenuhi kondisi rekonstruksi bahkan jika Komponen
CRT hilang. Seperti yang ditunjukkan pada [16], ketika , CRT, dan Sepanjang makalah ini, kami berasumsi bahwa
Pada dasarnya, MinDiff mengkodekan satu set data yang tidak di mana adalah energi yang dihabiskan oleh sebuah node untuk mentransmisikan
terkompresi = { } dengan kumpulan data terkompresi lainnya = { ,1 satu bit dan adalah jumlah keseluruhan bit yang ditransmisikan dengan
, . . . , }, di mana = min { } adalah nilai minimum dalam dan apakah mempertimbangkan teknik pengumpulan data spesifik yang diturunkan dalam
perbedaannya? = - μ diwakili dengan = kancatatan2(maks { } + 1) Bagian 4 (lihat (7)–(10)).
⌉ bit masing-masing. Misalnya, dalam kasus pengumpulan data berbasis
Jumlah bit diperlukan untuk mewakili himpunan TEC adalah TEC = TEC = / TEC dan sebagai akibatnya,
perbedaan dan nilai μ diperlukan untuk rekonstruksi yang
tepat dan oleh karena itu biaya overhead + catatan2( ) bit 1
ERFTEC = 100 (1 ). (21)
harus dipertimbangkan. TEC
Oleh karena itu, faktor kompresinya mempertimbangkan blok nilai-nilai
dari -bit masing-masing dapat diperoleh sebagai
Namun, dalam kasus jaringan lossy, jumlah bit yang
dikirim dan diterima berbeda dan yang diharapkan
⋅
,perbedaan kecil =
. (18) faktor reduksi energi harus dinyatakan dengan mempertimbangkan
+ catatan2 () + memperhitungkan jumlah bit yang sebenarnya diteruskan.
Untuk tujuan perbandingan, kami memutuskan untuk mengevaluasi
4.4. Model Energi.Demikian pula untuk pekerjaan lain (misalnya, [16, 19]), energi mempertimbangkan node milik cluster 2 (yaitu, CL2).
kami mempertimbangkan model energi sederhana di mana untuk setiap Kami membatasi analisis kami ke node dari cluster kedua
bit yang akan ditransmisikan, sebuah node menghabiskan energi yang karena dua alasan. Pertama, node ini adalah yang paling kritis
sama dengan . Tampaknya, model tersebut mengabaikan energi yang karena mewakili tetangga sink. Bahkan, jika node ini kehabisan
dibutuhkan untuk komputasi dan penerimaan tetapi ini tidak benar jika energi, wastafel tetap terisolasi. Kedua, umur jaringan
kita merenungkan fakta bahwa dalam jaringan sensor jumlah bit yang didefinisikan sebagai waktu sampai node pertama dalam
ditransmisikan, jumlah bit yang diterima, dan jumlah operasi jaringan mati dan dengan probabilitas tinggi, jika tidak pasti,
pemrosesan yang semua sebanding dengan jumlah ukuran yang node ini milik CL2 mengingat bahwa semua pesan dirutekan ke
dirasakan. Jadi energi yang dibutuhkan untuk komputasi dan sink melalui node ini.
penerimaan dapat dengan mudah dimasukkan ke dalam . Akhirnya, mengingat masa pakai jaringan terkait dengan energi
Sebagai contoh, mari kita anggap bahwa sebuah node untuk maksimum yang dikonsumsi oleh sebuah node dalam makalah ini,
penginderaan dan pemrosesan langkah-langkah dari bit kami juga menyelidiki faktor reduksi energi yang terkait dengan
membutuhkan energi yang sama dengan ⋅ dan itu, menggunakan energi maksimum:
teknik kompresi yang tepat dengan faktor kompresi sama dengan , ini
mengurangi jumlah bit yang akan ditransmisikan dari ke / . Dalam hal RAW, maks - ,maksimal .
ERF,maksimal = (22)
ini, energi keseluruhan adalah ⋅ + (/ ) yang dapat kita tulis ulang RAW, maks
sebagai ( / ) mempertimbangkan = + .
Terakhir, jika juga energi yang dibutuhkan untuk penerimaan Mengenai keandalan, kami menganggap bahwa sebuah
harus disertakan dan berbeda dengan energi yang digunakan untuk node gagal meneruskan paket dengan probabilitas dan
transmisi, mengingat untuk hampir semua node jumlah bit yang evaluasi rasionya , antara jumlah pengukuran mentah yang
diterima sama dengan jumlah bit yang ditransmisikan, itu akan diperoleh oleh sink dan jumlah pengukuran mentah yang
cukup untuk digunakan. = + + . dihasilkan dari node sumber atau, setara,
Oleh karena itu, penyederhanaan utama yang diperkenalkan
hilang, ,
oleh model kami adalah bahwa kami mempertimbangkan jarak- ,= 1 (23)
independen; yaitu, kami tidak menganggap itu dapat diubah ⋅
secara adaptif oleh lapisan MAC berdasarkan jarak antara node
di mana hilang, adalah jumlah pengukuran mentah yang hilang
sumber dan tujuan.
karena kesalahan jaringan dan/atau rekonstruksi.
,TEC dapat dengan mudah diperkirakan dengan mengasumsikan teknik
5. Metrik Kinerja decoding yang sempurna di mana semua data yang diterima didekodekan
dengan benar oleh sink.
Untuk memperkirakan efisiensi energi dari teknik di atas, mari
Sebenarnya jika ℎ adalah jumlah hop yang diperlukan untuk mencapai
kita perkenalkan: Faktor reduksi energi, ERF , yang mewakili
wastafel dan adalah probabilitas bahwa sebuah node gagal meneruskan a
persentase pengurangan energi yang dihabiskan menggunakan
teknik pengumpulan data tertentu ( ) dibandingkan dengan
paket, peluang paket hilang adalah = 1−(1− )ℎ
dan oleh karena itu jumlah data yang hilang yang diharapkan adalah hilang, TEC
kasus ketika ukuran mentah langsung dikirim ( MENTAH). Metrik
= . Sebagai konsekuensi
ini didefinisikan sebagai
di mana {TEC, CS, CRT, DCS}. Perhatikan bahwa keandalan teknik TEC hanya terkait dengan
Ketika jaringan lossless yang ideal dipertimbangkan, ERF parameter jaringan dan ℎ dan tidak dapat ditingkatkan tanpa
dapat dinilai sebagai
mengandalkan teknik pengkodean saluran (misalnya, FEC).
⋅ - ⋅ , Berbeda dari teknik TEC, untuk semua teknik pengumpulan
ERF,ideal = 100 (20)
⋅ data lainnya, keandalan dapat ditingkatkan dengan a
10 Jurnal Internasional Jaringan Sensor Terdistribusi
1
PR,TEC (Pe = 0,01)
nM = 10
1 0.9
nM = 100
0.9
0.8 PR,TEC (Pe = 0,05)
0,7 0.8
PR,CRT
0.6
PR,DSC
nM = 10
0,5
0.4
0,3 0,7
0.2 nM = 100
0.1
60 0.6
50 6
40 5
4
NCR 30 3
T 20 2 F 0,5
10 0 1 1 2 3 4 5 6
nR,DSC
Gambar 1: ,CRT untuk nilai yang berbeda CRT dan Kapan = 0,04.
nM = 10, pe = 0,05 N nM = 10, pe = 0,01 N
M = 100, pe = 0,05 M = 100, pe = 0,01
(i) CRT. Dalam kasus bilangan prima pengumpulan data CRT, angka dapat di mana hilang, DSC adalah jumlah paket yang hilang dengan memperhitungkan
dipilih sehingga semua ukuran mentah dapat direkonstruksi bahkan jika bahwa semua paket yang terkait dengan kejadian yang sama akan hilang jika
paling banyak Komponen CRT hilang. tidak ada paket kepala sel yang datang. Perhatikan bahwa yang diharapkan
Seperti yang ditunjukkan pada [16], ketika tetap, keandalannya dapat
Nilai dari hilang, DSC adalah hilang, DSC = ,DSC + ( - 1)(1
diperkirakan sebagai
,DSC) .
CT R - , Pada Gambar 2, kita dapat membandingkan keandalan TEC dan
,CRT = ( CRT) (1 ) (25) DSC untuk dua nilai yang berbeda dari probabilitas kerugian per
=0
hop ( = 0,01 dan = 0,05) dan jumlah hop yang tetap, = 4, ketika
nilai yang berbeda ,DSC dan jumlah node sumber yang berbeda
di mana = 1 (1 )ℎ adalah probabilitas bahwa komponen
dipertimbangkan.
CRT hilang.
Sebagai aturan umum, keandalan yang tinggi dapat diperoleh dengan
Karena mungkin untuk mengamati dengan
memperbaiki sehingga =CRT + di mana adalah konstanta kecil pada
memperbaiki ,DSC = 3 kita punya ,DSC ≥ ,TEC untuk berbagai
dan (yaitu, {0,01, 0,05} dan {10, 100}). Perhatikan juga
urutan dari √ CRT .
bahwa semakin meningkat ,DSC tidak membaik ,DSC sekali.
Hasil ini dapat dibenarkan dengan mempertimbangkan bahwa ,CRT (melihat
Hal ini dapat dibenarkan mengingat, untuk nilai tinggi,
(25)) dapat didekati dengan fungsi distribusi kumulatif
yaitu, ,DSC → , berikut ini ,DSC 1 ( - 1) / =
dari variabel normal dengan mean CRT dan varians
1 + / ≈ ,TEC.
CRT (1 ).
Jelas, kehandalan meningkat dengan jumlah retrans-
Misalnya, pada Gambar 1 kami menunjukkan keandalannya ,CRT
misi ,DSC tetapi dengan biaya mengurangi penghematan energi.
untuk nilai yang berbeda CRT dan Kapan = 0,04. Seperti yang
Jadi di bagian selanjutnya kami menyelidiki trade-off antara
mungkin untuk diamati, nilai-nilai kecil dari (misalnya, = 6)
keandalan dan konsumsi energi untuk nilai yang berbeda dari
cukup untuk mencapai nilai reliabilitas yang tinggi (>0.99).
,DSC.
Keandalan yang lebih tinggi dapat diperoleh dengan lebih
meningkatkan nilai parameter . Namun, dengan meningkatkan
(iii) CS. Dengan menunjukkan dengan jumlah paket yang dikirim dengan CS,
konsumsi energi juga meningkat sehingga pada bagian selanjutnya
kemungkinan untuk menerima setidaknya * paket adalah
kami menyelidiki trade-off antara keandalan dan konsumsi energi
untuk nilai yang berbeda dari . - *
- .
CS = ( ) (1 ) (27)
(ii) DSC. Juga dalam kasus DSC, probabilitas untuk kehilangan a =0
paket adalah = 1 (1 )ℎ. Namun, tindakan kompresi DSC tidak Oleh karena itu, dengan meningkatkan itu mungkin untuk menjamin
dapat dipulihkan jika informasi sampingan (yaitu, paket yang
itu, dengan probabilitas yang diinginkan CS, paling sedikit * paket
dihasilkan oleh kepala sel) tidak diterima.
diterima oleh sink. Sebagai aturan umum, keandalan yang tinggi
Jadi, untuk meningkatkan keandalan, kami menganggap bahwa
dapat diperoleh dengan memperbaiki sehingga =*/(1− ) + , di mana
kepala sel mentransmisikan ,DSC kali informasi samping.
adalah konstanta kecil.
Dalam hal ini, keandalan DSC dapat dievaluasi sebagai:
Namun, berbeda dari semua teknik sebelumnya, keandalan
hilang, DSC , CS tidak hanya terkait dengan jumlah paket yang diterima
,DSC = 1 (26)
sehingga CS, yang selanjutnya disebut keandalan jaringan, bukan
Jurnal Internasional Jaringan Sensor Terdistribusi 11
keandalan CS yang sebenarnya (ini membenarkan mengapa kami menggunakan notasi 100
CS dari pada CS). Faktanya, teknik CS didasarkan pada algoritma
rekonstruksi yang dapat menyebabkan kesalahan sehingga nilai 80
yang direkonstruksi ?̂? bisa berbeda dari data mentah asli .
Namun demikian, jika kita mengasumsikan bahwa data mentah adalah
nilai terkuantisasi (seperti biasa di WSN di mana ukuran mentah berasal dari 60
ERF
ADC), kita dapat menyatakan bahwa tindakan terkuantisasi dapat dipulihkan
dengan tepat jika kesalahan rekonstruksi |?̂? - | lebih kecil dari kesalahan 40
kuantisasi /2, dimana adalah langkah kuantisasi yang digunakan untuk
kuantisasi .
Oleh karena itu, dalam simulasi kami, kesalahan rekonstruksi, 20
|?̂? - |, dievaluasi untuk setiap ukuran dan data mentah dianggap
hilang jika kesalahan ini lebih besar dari /2. 0
Dari sudut pandang simulasi, keandalan CS yang sebenarnya dapat 8 16 32 64
dievaluasi sebagai: σ
hilang, CS , TEC
,CS = 1 (28) TECMODEL
⋅ DSCMODEL DSC
CRTMODEL CRT
di mana hilang, CS adalah jumlah tindakan yang hilang dengan
CSIMODEL CSI
mempertimbangkan baik packet loss maupun kesalahan rekonstruksi.
CS2MODEL CS2
Kami menunjukkan di bagian selanjutnya bahwa dengan
memilih CS = + 3 dan =*/(1 ) + 2 kita dapat memperoleh ,CS 1. Parameter Simulasi
Dua algoritma rekonstruksi dipertimbangkan untuk CS dalam ρ 0.1
makalah ini: rekonstruksi ideal (yaitu, berbasis oracle), di mana R 55M
R 18M
posisi tepat dari nilai bukan nol diasumsikan diketahui pada node
Pe 0
sink, dan CoSaMP [27]. Untuk membedakan di antara mereka, kami ρC 0,55
menunjukkan keandalannya sebagai ,CSI dan ,CoSaMP, masing- M 50
masing. F 0
nR,DSC 1
M M*
6. Hasil Simulasi
Gambar 3: ERF teknik pengumpulan data dalam hal jaringan
Di bagian ini, kami membandingkan teknik pengumpulan data
yang andal ( = 0), varian rendah ({8–64}), dan korelasi
dalam hal konsumsi energi dan keandalan. sedang (ρ = 0,55).
Hasil telah diperoleh melalui simulator C++ kustom. Untuk
setiap set parameter, hasil rata-rata dilaporkan dengan
mempertimbangkan 20 topologi acak di mana node berada Hasil yang sama diperoleh untuk nilai yang berbeda , yaitu,
terdistribusi secara merata dalam luas persegi 600×600 [M2], dengan mengubah jumlah ukuran mentah per paket. Ini dapat
dengan kepadatan [node/m2]. Kami juga berasumsi bahwa V dengan mudah dibenarkan oleh fakta bahwa MENTAH =
peristiwa secara acak terjadi di cluster yang jauh (misalnya, CL5 dan = keduanya sebanding dengan jadi rasio mereka dan
sehingga = 4 hop diperlukan untuk mencapai wastafel) dan setiap oleh karena itu juga ERF (lihat (19)) tidak tergantung pada . Jadi
peristiwa dideteksi oleh = ρπ 2 node sumber (di mana adalah hasil simulasi untuk nilai yang berbeda tidak ditampilkan demi
radius indra). ruang.
Jika tidak dinyatakan lain, V = 300 peristiwa dipertimbangkan Berdasarkan hasil sebelumnya, kita dapat menyatakan bahwa dalam
dan data mentah diwakili dengan = 12 bit (yang merupakan nomor kasus jaringan yang andal TEC dan DSChave ERF yang lebih besar dan oleh
khas untuk ADC yang digunakan dalam jaringan sensor). karena itu tampaknya mereka harus lebih disukai daripada teknik
pengumpulan data lain yang dianalisis. Namun, seperti yang ditunjukkan pada
6.1. ERF dengan Jaringan yang Handal.To asses the bagian berikutnya, hasil ini tidak benar ketika keandalan menjadi masalah.
simulator we first analyzed an ideal (fully reliable) WSN and
evaluated the ERF for different values of and when Perhatikan bahwa dalam simulasi kami ERFDSC dan ERFTEC
different data gathering techniques (TEC, CRT, DSC, and CS) hampir sama karena kami menetapkan nilai yang sama untuk
are considered. In particular, for CS two cases have been koefisien korelasi spasial dan temporal. Jelas, ketika korelasi
considered: an ideal case (CSI) where the sparsity level = / spasial dan temporal tidak sama, hasil yang berbeda dapat
is fixed to the minimum value = ideal such that ,CS = ,ideal ( diperoleh.
see (17) and (14)) and a second case (CS2) where a slightly Akhirnya, perhatikan bahwa meskipun CRT tampaknya menjadi yang
greater value = 1.2 ⋅ ideal is used. terburuk dalam hal ERF, ini adalah satu-satunya teknik pengumpulan
As shown in Figures 3 and 4, the results obtained through data di mana algoritma kompresi yang sebenarnya (MinDiff) telah
the analytical model (see (20)) and those reported by the dipertimbangkan (untuk semua teknik lainnya, faktor kompresi yang
simulator are very close to each other for all the values of and ideal telah diasumsikan). Jadi hasil simulasi sebelumnya memungkinkan
considered. These results confirm the validity of our model. kuantifikasi penalti dalam menggunakan kompresi sederhana
12 International Journal of Distributed Sensor Networks
100 100
80 80
60 60
ERF
ERF
40 40
20 20
0 0
32 64 128 256 8 16 32 64
0.1 0.1
R 55m R 55m
r 18m r 12m
pe 0 pe 0
c 0.97 c 0.55
M 50 M 50
f 0 f 0
Nr,DSC 1 Nr,DSC 1
m m∗ m m∗
Figure 4: ERF of data gathering techniques in the case of reliable Figure 5: ERF of data gathering techniques in the case of reliable
network ( = 0), high variance ( ∈ {32–256}), and high correlation network ( = 0) and lower sensing radius ( = 12).
( = 0.97).
100 1
0.995
80
0.99
0.985
60
0.98
PR
ERF
40 0.975
0.97
20 0.965
0.96
0 8 16 32 64
8 16 32 64
TEC TECMODEL
TECMODEL TEC DSC DSCMODEL
DSCMODEL DSC CRT CRTMODEL
CRTMODEL CRT CSI
CSIMODEL CSI CS2
CS2MODEL CS2
Simulation Parameters
Simulation Parameters 0.1
0.045 R 55m
R 55m r 18m
r 18m pe 0.01
pe 0 c 0.55
c 0.55 M 50
M 50 f 8
f 0 Nr,DSC 3
Nr,DSC 1 m m∗/(1 − pn) + 2
m m∗
Figure 7: Reliability of data gathering techniques for = 0.01.
Figure 6: ERF of data gathering techniques in the case of reliable
network ( = 0) and lower density ( = 0.045).
CS and sparsity levels when = 12. Simulation parameters are
those reported in Figure 3.
measures sufficient for reconstruction, and therefore original As it is possible to observe, when CS < 15 reliability
measurements can be perfectly recovered (so that ,CS = 1). In quickly decreases.
the next subsection, we will show that this is true only if CS = + Similar results have been obtained for different values of
3, as chosen for our simulations. .
Obviously, high reliability is achieved at the cost of a lower However, inpractice, actual reliability depends also on the
ERF but, by comparing Figures 8 and 3, we can state that the reconstruction algorithm used. For the sake of completeness,
impact on the ERF is quite low (both ERFCRT and ERFCS we report in Figure 10 CS reliability when the CoSaMP [27]
decrease by a few percent). algorithm is used for reconstruction.
As it is possible to observe also in this case CS = 15 is
As a consequence when high reliability is needed even with
needed for achieving high reliability. Nevertheless, perfect
unreliable networks, CRT and CS should be preferred.
reliability is not obtained with CoSaMP when = ∗. So in
some cases CRT could be preferred to CS because reliability
6.3. CS Reliability. In all the previous simulations, we have can be better predicted.
fixed the number of bits CS used for representing quantized
CS measures equal to + 3. A careful reader could observe
6.4. ERF and Network Lifetime. The ERF metric is an
that this choice is questionable and that by reducing CS
expression of mean energy consumptions; instead, network
higher values of ERFCS can be obtained. This consideration is
lifetime ismore closely related tomaximumenergy
partially true: effectively, ERFCS increases for lower values of CS, consumptions.
but our simulation results show that using values of CS In Figure 11, we report ERFmax instead of ERF for different
below +3 is not possible to have perfect reconstruction (i.e., data gathering techniques. ERFmax is evaluated on the basis of
,CS = 1). (22), that is, considering the maximum energy consumptions for
To convince the reader in Figure 9, we report simulation nodes belonging to cluster CL2. Maximum energies have greater
results about the actual reliability ,CS for different values of variations in comparison to mean values so in order
14 International Journal of Distributed Sensor Networks
100 1
80 0.8
60 0.6
PR,CS
ERF
40 0.4
20 0.2
0 0
8 16 32 64 8 16 32 64
M 50
f 8
3 40
Nr,DSC
m m∗/(1 − pn) + 2
0
8 16 32 64
1
0.99
TEC CSI
0.98 DSC CS2
0.97 CRT
0.96 Simulation Parameters
PR,CS
0.95 0.1
0.94 R 55m
r 18m
0.93 pe 0.01
0.92 c 0.55
M 50
0.91 8
f
0.9 Nr,DSC 3
13 14 15 m m∗/(1 − pn) + 2
bCS
Figure 11: ERFmax of data gathering techniques for = 0.01.
CSI = 8 CS2 = 8
CSI = 16 CS2 = 16
CSI = 32 CS2 = 32
CSI = 64 CS2 = 64 As it is possible to observe, TEC and DSC have higher ERF
max and therefore greater network lifetime can be expected
Figure 9: ,CSI for different values of CS and sparsity levels when
= 12. when DSC and TEC are used for data gathering.
Finally, note that CRT and CS have similar performance if
the actual sparsity degree of CS is 20% more than the
to have higher confidence we increased the number of events to minimum (ideal) value. These observations can be extended
V = 3000. also to all the previous simulations.
International Journal of Distributed Sensor Networks 15
7. Conclusions and Future Works ERF : Energy reduction factor of the data
gathering technique ∈ {TEC, CS, DSC,
In this paper, we have compared several data gathering : CRT} Reliability of the data gathering
techniques used in WSNs by using both simulation results and technique ∈ {TEC, CS, DSC, CRT}
analytical models. In particular, the effectiveness of the above : Minimum value within set { }; that is, =
techniques has been investigated in terms of reliability (packet min { }
loss and reconstruction errors) and energy efficiency (i.e., ERF : Difference with the minimum element of {
and network lifetime) by systematically sampling the parameter }; that is, = − Compressed sensing
space (i.e., number of nodes, transmission range, and sparsity). : measurement Number of CS
Basically we can summarize our results as follows: : measurements Minimum/sufficient
∗: number of CS measurements for
reconstruction
(i) DSC and TEC techniques should be preferred for
: Number of nonzero components of a -
maximizing network lifetime.
sparse signal
(ii) CS should be preferred when high reliability is : Sparsity level of CS measurements; that is,
needed. = /
: Correlation coefficient of raw
(iii) CRT should be preferred for its inherent lowcomplexity.
measurements
: Standard deviation of raw measurements
As a consequence, we can state that there is no best : Maximum transmission distance (coverage
solution for all possible applications and that only the tradeoff radius)
between energy consumptions, reliability, and complexity : Sense radius of a node
candrive the choice of the data gathering technique to be used CRT: Number of CRT relayers
for a specific application. : Grid size (edge in meter)
As future work, we plan to refine and improve the model to : Node density
deal with actual correlated measurements (i.e., not only : Energy spent for each transmitted bit
Gaussian data) and more realistic propagation channels (i.e., by : Shannon’s entropy
taking into account actual distance between nodes). ,DSC: Number of retransmissions for the clus-
ter/cell head when DSC is used
CLℎ: Cluster number ℎ
Notations
ℎ: Number of hops between nodes in clusters
TEC: Transform and Encoding-Based CLℎ+1 and CLℎ
Compression V: Number of events used for simulations.
CS: Compressive sensing
DSC: Distributed source coding Chinese Competing Interests
CRT: Remainder Theorem Generic data
: gathering technique; that is, ∈ {TEC, CS, The authors declare that they have no competing interests.
DSC, CRT}
= { }: A set of uncompressed values (raw References
measurements)
: Number of bits used to represent a raw [1] I. F. Akyildiz, W. Su, Y. Sankarasubramaniam, and E. Cayirci, “A
value (without compression) survey on sensor networks,” IEEE Communications Magazine,
: Number of measurements/words per vol. 40, no. 8, pp. 102–105, 2002.
packet [2] Z. Xiong, A. D. Liveris, and S. Cheng, “Distributed source coding
: Number of source nodes for sensor networks,” IEEE Signal Processing Magazine, vol. 21,
X: Matrix of × raw data of -bits each th no. 5, pp. 80–94, 2004.
x : column of the matrix X (measures taken [3] D. Zordan, B. Martinez, I. Vilajosana, and M. Rossi, “On the
performance of lossy compression schemes for energy
by nodes almost at the same time)
constrained sensor networking,” ACM Transactions on Sensor
Networks, vol. 11, no. 1, article 15, 2014.
: Compression factor of the data gathering
[4] G. Campobello, O. Giordano, A. Segreto, and S. Serrano,
technique ∈ {TEC, CS, DSC, CRT} Number
“Comparison of local lossless compression algorithms for
: of bits used to represent a compressed
wireless sensor networks,” Journal of Network and Computer
measure with data gathering technique Applications, vol. 47, pp. 23–31, 2015.
[5] J. Chou, D. Petrovic, and K. Ramachandran, “A distributed and
: Number of bits per packet when data adaptive signal processing approach to reducing energy
gathering technique is used Overall consumption in sensor networks,” inProceedings of the
: number of bits transmitted for each 22ndAnnual Joint Conference of the IEEE Computer and
event when the data gathering Communications (INFOCOM ’03), vol. 2, pp. 1054–1062, IEEE,
technique is used San Francisco, Calif, USA, March-April 2003.
16 International Journal of Distributed Sensor Networks
[6] X. He, X. Zhou, M. Juntti, and T. Matsumoto, “Data and error rate on Computing, Networking and Communications (ICNC ’15), pp.
bounds for binary data gathering wireless sensor networks,” 911–917, IEEE, Garden Grove, Calif, USA, Feburary 2015.
in Proceedings of the IEEE 16th International Workshop on Signal [23] F. Marcelloni and M. Vecchio, “An efficient lossless compression
Processing Advances in Wireless Communications (SPAWC ’15), pp. algorithm for tiny nodes of monitoring wireless sensor
505–509, Stockholm, Sweden, June 2015. networks,” The Computer Journal, vol. 52, no. 8, pp. 969–987,
[7] C. Karakus, A. C. Gurbuz, and B. Tavli, “Analysis of energy 2009.
efficiency of compressive sensing in wireless sensor networks,” [24] Y. Liang and W. Peng, “Minimizing energy consumptions in
IEEE Sensors Journal, vol. 13, no. 5, pp. 1999–2008, 2013. wireless sensor networks via two-modal transmission,” ACM
[8] H. Zheng, S. Xiao, X. Wang, X. Tian, and M. Guizani, “Capacity and SIGCOMMComputer Communication Review, vol. 40, no. 1, pp.
delay analysis for data gathering with compressive sensing in 12–18, 2010.
wireless sensor networks,” IEEE Transactions on Wireless
[25] S. S. Chen, D. L. Donoho, and M. A. Saunders, “Atomic
Communications, vol. 12, no. 2, pp. 917–927, 2013.
decomposition by basis pursuit,” SIAM Review, vol. 43, no. 1, pp.
[9] H. Zheng, F. Yang, X. Tian, X. Gan, X. Wang, and S. Xiao, “Data 129– 159, 2001.
gatheringwith compressive sensing inwireless sensor networks: a
[26] J. A. Tropp and A. C. Gilbert, “Signal recovery from random
random walk based approach,” IEEE Transactions on Parallel and
measurements via orthogonal matching pursuit,” IEEE
Distributed Systems, vol. 26, no. 1, pp. 35–44, 2015.
Transactions on Information Theory, vol. 53, no. 12, pp. 4655–
[10] L. Zhu, B. Ci, Y. Liu, and Z. D. Chen, “Data gathering in wireless sensor 4666, 2007.
networks based on reshuffling cluster compressed sensing,”
[27] J. A. Tropp and D. Needell, “CoSaMP: iterative signal recovery from
International Journal of Distributed Sensor Networks, vol. 2015, 13
incomplete and inaccurate samples,” Applied and Computational
pages, 2015.
Harmonic Analysis, vol. 26, no. 3, pp. 301–321, 2009.
[11] E. J. Candes andT. Tao, “Near-optimal signal recovery fromrandom
projections: universal encoding strategies?” IEEE Transactions on [28] E. Candes and M. Wakin, “An introduction to compressive
Information Theory, vol. 52, no. 12, pp. 5406–5425, 2006. sampling,” IEEE Signal Processing Magazine, vol. 25, no. 2, pp.
21–30, 2008.
[12] D. L. Donoho, “Compressed sensing,” IEEE Transactions on
Information Theory, vol. 52, no. 4, pp. 1289–1306, 2006. [29] V. Chandrasekaran, B. Recht, P. A. Parrilo, and A. S. Willsky, “The
convex geometry of linear inverse problems,” Foundations of
[13] T. Srisooksai, K. Keamarungsi, P. Lamsrichan, and K. Araki,
Computational Mathematics, vol. 12, no. 6, pp. 805–849, 2012.
“Practical data compression in wireless sensor networks: a
survey,” Journal of Network and Computer Applications, vol. 35, [30] X. Wang, Z. Zhao, Y. Xia, and H. Zhang, “Compressed sensing for
no. 1, pp. 37–59, 2012. efficient random routing in multi-hop wireless sensor
networks,” in Proceedings of the IEEE GLOBECOMWorkshops
[14] J.-H. Chang and L. Tassiulas, “Maximum lifetime routing in
wireless sensor networks,” IEEE/ACMTransactions on
(GC Wkshps ’10), pp. 266–271, IEEE, Miami, Fla, USA, December
2010.
Networking, vol. 12, no. 4, pp. 609–619, 2004.
[15] Y. Wu, Z. Mao, S. Fahmy, and N. B. Shroff, “Constructing [31] A. Razi, K. Yasami, and A. Abedi, “On minimum number of
maximum-lifetime data-gathering forests in sensor networks,” wireless sensors required for reliable binary source estimation,”
IEEE/ACM Transactions on Networking, vol. 18, no. 5, pp. 1571– in Proceedings of the IEEE Wireless Communications and
1584, 2010. Networking Conference (WCNC ’11), pp. 1852–1857, IEEE,
Cancun, Mexico, March 2011.
[16] G. Campobello, A. Leonardi, and S. Palazzo, “Improving energy
saving and reliability in wireless sensor networks using a simple [32] S. S. Pradhan and K. Ramchandran, “Distributed source coding using
CRT-based packet-forwarding solution,” IEEE/ACM Transactions syndromes (discus): design and construction,” in Proceedings of the
on Networking, vol. 20, no. 1, pp. 191–205, 2012. Data Compression Conference (DCC ’99), pp. 158–167, March 1999.