Anda di halaman 1dari 17

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

Perusahaan Penerbitan Hindawi


Jurnal Internasional Jaringan Sensor Terdistribusi
Volume 2016, ID Artikel 4156358, 17 halaman http://
dx.doi.org/10.1155/2016/4156358

Artikel Penelitian
Teknik Pengumpulan Data untuk Jaringan Sensor Nirkabel:
Perbandingan

Giuseppe Campobello, Antonino Segreto, dan Salvatore Serrano

Departemen Teknik, Universitas Messina, Contrada Di Dio, Sant'Agata, 98166 Messina, Italia

Korespondensi harus ditujukan kepada Giuseppe Campobello; gcampobello@unime.it

Diterima 2 November 2015; Revisi 3 Februari 2016; Diterima 4 Februari 2016

Editor Akademik: Haiping Huang

Hak Cipta © 2016 Giuseppe Campobello dkk. Ini adalah artikel akses terbuka yang didistribusikan di bawah Lisensi Atribusi Creative
Commons, yang mengizinkan penggunaan, distribusi, dan reproduksi tanpa batas dalam media apa pun, asalkan karya aslinya dikutip
dengan benar.

Kami mempelajari masalah pengumpulan data dalam jaringan sensor nirkabel dan membandingkan beberapa pendekatan yang termasuk dalam
bidang penelitian yang berbeda; khususnya, pemrosesan sinyal, penginderaan tekan, teori informasi, dan teknik pengumpulan data terkait jaringan
diselidiki. Secara khusus, kami memperoleh model analitik sederhana yang dapat memprediksi efisiensi energi dan keandalan berbagai teknik
pengumpulan data. Selain itu, kami melakukan simulasi untuk memvalidasi model kami dan untuk membandingkan efektivitas skema di atas dengan
secara sistematis mengambil sampel ruang parameter (yaitu, jumlah node, jangkauan transmisi, dan sparitas). Hasil simulasi dan analisis kami
menunjukkan bahwa tidak ada teknik pengumpulan data terbaik untuk semua aplikasi yang mungkin dan bahwa pertukaran antara konsumsi energi
dan keandalan dapat mendorong pilihan teknik pengumpulan data yang akan digunakan. Dalam konteks ini, model kami bisa menjadi alat yang
berguna.

1. Perkenalan Jadi, berbeda dengan banyak perangkat nirkabel lainnya


(misalnya, telepon seluler, PDA, dan laptop), biasanya tidak
Jaringan sensor nirkabel (WSN) terdiri dari banyak sensor diharapkan untuk memperbarui energi yang disuplai ke node
nirkabel kecil, berdaya rendah, dan murah, ditempatkan di area sensor nirkabel selama masa pakai WSN. Untuk alasan ini, setiap
geografis untuk melakukan tugas terdistribusi, misalnya, untuk node sensor diperlukan untuk bekerja di bawah kondisi konsumsi
memantau fenomena fisik [1]. Pada tahun 2004, MIT daya yang sangat rendah.
Technology Review memberi peringkat WSNs sebagai teknologi Secara umum, untuk merancang WSN yang sangat hemat
yang muncul nomor satu [2] dan hari ini mereka digunakan energi, sangat penting untuk mempertimbangkan masalah
secara efektif untuk banyak aplikasi, seperti pengawasan penangkapan, transmisi, dan perutean, yaitu, teknik
(misalnya, pengawasan audio atau video area waktu nyata), pengumpulan data yang menentukan cara kerja sensor biasa
keamanan (misalnya, deteksi biologis agen atau bahan kimia untuk mengumpulkan informasi dan mengirimkannya ke sink.
beracun), pemantauan kebiasaan (misalnya, pengukuran Akibatnya, pengumpulan data adalah fungsi utama dan lebih
lingkungan suhu, tekanan, atau getaran mekanis), otomatisasi kritis yang disediakan oleh WSN.
rumah, sistem militer, dan, secara umum, eksperimen ilmiah. Tujuan utama dari makalah ini adalah untuk membandingkan
Dalam topologi WSN yang khas, kita dapat membedakan beberapa teknik pengumpulan data state-of-the-art mempertimbangkan
antara node sensor nirkabel biasa dan stasiun pangkalan trade-off antara keandalan (yaitu, kehilangan paket dan kesalahan
bernama sink. Wastafel biasanya terhubung ke catu daya dan rekonstruksi) dan konsumsi energi (yaitu, masa pakai jaringan) dengan
mampu melakukan operasi yang lebih kompleks daripada node mempertimbangkan memperhitungkan aspek kompresi dan jaringan.
biasa. Node sensor nirkabel biasa, yang mampu mentransfer Sejauh pengetahuan kami, ini adalah makalah pertama yang
data yang diproses atau dirasakan mentah ke wastafel, karena mempertimbangkan jenis perbandingan untuk teknik pengumpulan data
alasan ekonomis, biasanya ditenagai oleh baterai ukuran kecil yang termasuk dalam bidang penelitian yang berbeda (yaitu,
yang dalam sebagian besar skenario aplikasi sulit atau bahkan pemrosesan sinyal, penginderaan tekan, teori informasi, dan teknik
tidak mungkin untuk diganti atau diisi ulang. terkait jaringan yang dibahas dan dibandingkan.
2 Jurnal Internasional Jaringan Sensor Terdistribusi

dalam makalah ini). Secara khusus, kami memperoleh model analitik trade-off yang berbeda antara keandalan dan penghematan energi.
sederhana yang dapat memprediksi efisiensi energi dan keandalan Akhirnya, dalam [17], penulis membahas masalah memaksimalkan masa
beberapa teknik pengumpulan data. Selain itu, kami melakukan pakai jaringan dengan mempertimbangkan juga latensi dan keandalan.
simulasi untuk memvalidasi model kami dan untuk membandingkan
efektivitas skema di atas dengan secara sistematis mengambil Namun, dengan pengecualian [15], makalah di atas tidak
sampel ruang parameter (yaitu, jumlah node, jangkauan transmisi, melakukan agregasi data apa pun dengan tujuan tidak
dan sparitas). menimbulkan penundaan tambahan.
Sisa makalah ini disusun sebagai berikut. Di Bagian 2, kami
Seperti yang ditunjukkan pada [18-21], dengan menggabungkan agregasi
menyajikan ringkasan karya terkait. Di Bagian 3, rincian lebih lanjut
data dan mekanisme perutean, skema pengumpulan data yang efisien dapat
tentang teknik pengumpulan data yang ada diberikan dengan
diperoleh.
menyoroti kelebihan dan kekurangannya. Di Bagian 4, skenario
Secara khusus dalam [18], masalah routing yang dioptimalkan
simulasi yang digunakan untuk perbandingan dirinci dan model
bersama dan agregasi data diselidiki; di [19], penulis
analitis yang dapat memprediksi efisiensi energi dan keandalan dari
menggabungkan kompresi data dan teknik perutean multipath
berbagai teknik pengumpulan data diturunkan. Di Bagian 5, metrik
untuk mendapatkan skema agregasi data yang andal dan latensi
yang digunakan untuk membandingkan teknik pengumpulan data
rendah; di [20], skema pengumpulan dan pengumpulan data yang
diperkenalkan. Pada Bagian 6, hasil simulasi disediakan dan model
seimbang energi diusulkan yang mengintegrasikan struktur hierarki
analitik yang dikembangkan divalidasi. Akhirnya, di Bagian 7,
pengelompokan dengan penginderaan tekan untuk
beberapa komentar penutup dan pekerjaan masa depan digambar.
mengoptimalkan dan menyeimbangkan jumlah data yang
ditransmisikan; akhirnya di [21] teknik pengumpulan data
Demi kejelasan, simbol dan notasi yang digunakan di
berdasarkan paradigma pengkodean jaringan diusulkan.
seluruh makalah dilaporkan di bagian Notasi.
Rincian lebih lanjut tentang karya-karya di atas akan diberikan di
Bagian 3.4.
2. Pekerjaan Terkait
Beberapa makalah lain ada yang membandingkan teknik
Dalam beberapa tahun terakhir, beberapa teknik pengumpulan data pemrosesan sinyal di WSN dari efisiensi energi dan perspektif masa
telah diusulkan untuk WSN dengan tujuan utama mengurangi pakai jaringan dan beberapa karya menyoroti efek penggunaan
konsumsi energi di WSN dengan memanfaatkan korelasi antara mekanisme perutean yang berbeda untuk pengumpulan data.
data sensorik. Kita dapat membedakannya menjadi dua kategori Namun demikian, teknik milik bidang penelitian yang
besar: berorientasi kompresi dan berorientasi jaringan. berbeda seperti penginderaan tekan, teori informasi, dan
Kategori pertama, bernama berorientasi kompresi, difokuskan jaringan jarang dievaluasi satu sama lain dan ini adalah
untuk memaksimalkan masa pakai jaringan dengan memanfaatkan tujuan utama dari makalah ini.
teknik kompresi data [3-10]. Secara khusus, [3, 4] menganalisis Baru-baru ini, perbandingan tersebut telah dimulai, misalnya,
skema kompresi lossless yang berbeda untuk WSN yang [22] di mana teknik agregasi data lossy dievaluasi dan dibandingkan
mengeksploitasi korelasi temporal dalam sinyal sampel; dalam [5, dalam hal kesalahan rekonstruksi dan konsumsi energi. Namun,
6], penulis memanfaatkan korelasi spasial dengan menggunakan penulis tidak mempertimbangkan dampak dari keandalan jaringan
teknik pengkodean sumber terdistribusi berdasarkan teorema (yaitu, kehilangan paket) atau membandingkan teknik pengumpulan
Slepian-Wolf; akhirnya, [7-10] menyelidiki batas mendasar dari data berbasis jaringan seperti yang didasarkan pada paradigma
teknik pengumpulan data berdasarkan paradigma baru pengkodean jaringan.
penginderaan tekan [11, 12]. Sebuah tinjauan komprehensif
Tujuan dari makalah ini adalah untuk mengisi kesenjangan ini
pendekatan kompresi data yang ada di WSNs disediakan di [13].
dengan menyelidiki efektivitas semua teknik pengumpulan data di atas
Rincian lebih lanjut tentang teknik pengumpulan data
juga dalam hal keandalan. Secara khusus, model analitik yang dapat
berorientasi kompresi akan diberikan di Bagian 3. Secara
memprediksi efisiensi energi dan keandalan dari berbagai teknik
khusus, pemrosesan sinyal, penginderaan tekan, dan teknik
pengumpulan data diturunkan.
terkait teori informasi dibahas, masing-masing, di Bagian 3.1,
3.2, dan 3.3.
Karena transmisi radio adalah sumber utama konsumsi 3. Teknik Pengumpulan Data
daya di WSN, kategori kedua dari teknik pengumpulan data,
Kita dapat mengklasifikasikan skema pengumpulan data berdasarkan
bernama berorientasi jaringan, telah menangani masalah
bidang penelitian dari mana teknik yang digunakan untuk
memaksimalkan masa pakai jaringan dengan
mengeksploitasi korelasi antara node sensor diambil, yaitu,
mempertimbangkan protokol jaringan dan, lebih khusus lagi,
mekanisme penerusan/perutean [14-17]. (i) pemrosesan sinyal;
Secara khusus, dalam [14], penulis menunjukkan bagaimana
(ii) penginderaan tekan;
mungkin untuk memaksimalkan masa pakai WSN dengan
mengeksploitasi algoritma perutean. Dalam [15], penulis mempelajari (iii) teori informasi;
masalah konstruksi hutan untuk memaksimalkan masa pakai jaringan (iv) jaringan.
dan mengadopsi model agregasi data sederhana di mana sensor
perantara dapat menggabungkan beberapa pesan masuk menjadi satu Teknik-teknik yang termasuk dalam bidang-bidang di atas dibahas
pesan keluar. Pendekatan yang berbeda diusulkan dalam [16] di mana dalam subbagian berikutnya dengan menyoroti kelebihan dan
teknik pemisahan cerdas digunakan untuk mencapai kekurangannya.
Jurnal Internasional Jaringan Sensor Terdistribusi 3

3.1. Teknik Pemrosesan Sinyal.Sering ada korelasi tinggi (spasial oleh karena itu rasio kompresi yang tinggi dapat dicapai dengan
dan/atau temporal) di antara pembacaan sensor. Dalam hal ini, menggunakan CS (yaitu, dengan mentransmisikan pengukuran CS   alih-alih
tidak efisien untuk mengirimkan seluruh data mentah ke tujuan data mentah ).
[8, 9] dan pemrosesan sinyal, khususnya teknik Transforms and Rekonstruksi dicapai dengan memecahkan masalah
Encoding Compression (TEC), dapat dimanfaatkan untuk optimasi kompleks dari bentuk berikut:
mengurangi jumlah data yang akan dikirim.
Dalam kasus teknik TEC lokal, node mengumpulkan argmin kan1
(1)
pengukuran mengikuti teorema pengambilan sampel Shannon-
st =,
Nyquist; pengukuran ini ditransformasikan dan dikodekan
dengan benar dan output dari transformasi tersebut disimpan di mana = . Setelah masalah di atas terpecahkan,   dapat
dalam muatan satu atau lebih paket dan dikirim ke sink. Secara dipulihkan sebagai = . Sebagai alternatif, ketika langkah-langkah
khusus, teknik lossy atau lossless dapat digunakan tergantung bersuara dipertimbangkan, masalah optimasi berikut dapat
pada skenario aplikasi tertentu. dipertimbangkan:
Dengan teknik lossy [3], data asli dikompres dengan membuang
beberapa informasi asli; ini memungkinkan pencapaian rasio
argmin kan1
kompresi yang lebih tinggi tetapi di sisi penerima hanya dapat
(2)
st -  α 2   
2,
merekonstruksi data dengan akurasi tertentu.
Namun, dalam beberapa jenis pemantauan, keakuratan di mana ε membatasi kebisingan.
pengamatan sangat penting untuk memahami proses fisik yang Ada beberapa algoritma yang mampu memecahkan
mendasarinya. Dalam kasus lain, tidak mungkin untuk memiliki masalah optimasi di atas (Basis Pursuit [25], OMP [26], dan
pengetahuan apriori tentang besarnya kesalahan pengamatan yang CoSaMP [27], untuk menyebutkan beberapa saja) dan beberapa
dapat ditoleransi tanpa mempengaruhi pengumpulan data yang hasil teoretis ada yang menjelaskan kapan algoritma ini
benar. Selain itu, beberapa domain aplikasi (misalnya, BAN jaringan memulihkan solusi sparse. Khususnya,
area tubuh di mana node sensor secara permanen memantau dan
mencatat tanda-tanda vital) menuntut sensor dengan akurasi tinggi (i) sebagaimana dibuktikan dalam [28], sebuah sinyal   dapat dipulihkan
dan tidak dapat mentolerir pengukuran yang rusak oleh proses dengan probabilitas tinggi jika memenuhi Restricted Isometric
kompresi lossy. Property (RIP).

Dalam semua jenis WSN ini, pengumpulan data lossless Secara formal, amatrixΦmemenuhi RIP jika untuk semua -
sangat penting dan diinginkan. Contoh skema kompresi sinyal jarang   ada δ  (0, 1) seperti yang
lossless lokal telah diusulkan di [4, 23, 24].
Teknik kompresi lossy telah dievaluasi dan dibandingkan (1 )2 2 i2 2 (1 + )2 2. (3)
dalam hal kesalahan rekonstruksi dan konsumsi energi di [22];
oleh karena itu, dalam makalah ini kami memusatkan perhatian Contoh matriks yang memenuhi kondisi RIP adalah ±1
kami pada teknik lossless. Matriks Bernoulli dan matriks distribusi Gaussian
Demi ruang, kami tidak mempertimbangkan teknik TEC di mana φ, (0,2 Φ) dengan σ2Φ = 1/ .
terdistribusi dalam makalah ini tetapi kami merujuk pembaca ke
(ii) Seperti yang dibuktikan pada [29], dalam kasus bebas noise,
[13]. Namun demikian, pendekatan terdistribusi utama dari
pemulihan eksak dengan matriks Gaussian dapat diperoleh jika
pemrosesan sinyal yang diterapkan pada WSN akan dibahas dalam
subbagian berikutnya.   5
=* = 2  catatan ( ) + + 1. (4)
  4
3.2. Penginderaan Kompresi.Penginderaan kompresif (CS) adalah paradigma
baru yang diperkenalkan oleh Candes dan Tao [11] dan Donoho [12] yang Kami akan mengeksploitasi hasil di atas untuk mendapatkan model
digunakan untuk menangkap dan mengompresi sinyal di WSN di mana keandalan untuk CS.
kompresi dan pengambilan sampel digabungkan dan dilakukan pada saat CS dapat diterapkan dalam WSN berbasis cluster mengingat setiap
yang bersamaan. Pada dasarnya, CS mengompresi sinyal saat memperoleh node sensor dalam sebuah cluster mengirimkan bacaannya    ke kepala
data pada tingkat informasinya (tanpa bergantung pada teorema pengambilan cluster yang akan mengalikan semua pembacaan yang diterima dengan
sampel Shannon-Nyquist). Teori CS menyatakan bahwa jika suatu sinyal jarang koefisien acak φ, dengan menghasilkan   jumlah tertimbang    = Σ  φ,  
atau dapat dimampatkan dalam basis tertentu, maka sinyal tersebut dapat dengan [1, . . . , ].Selanjutnya, nilai   , bernama pengukuran CS,
direkonstruksi dari sejumlah kecil pengukuran linier dengan menyelesaikan dikirim ke sink melalui satu atau beberapa paket.
suatu 1 berbasis masalah optimasi cembung [7]. Berdasarkan teori CS, dalam kondisi sparity, dengan
Lebih tepatnya, mari kita definisikan -sinyal jarang = (1, . . . , mengumpulkan jumlah pengukuran CS yang cukup, sink
 )  sebagai sinyal yang dapat dinyatakan sebagai = , di mana adalah akan dapat merekonstruksi data sensor asli.   .
transformasi ortonormal dan α adalah vektor dengan paling banyak   CS dapat diterapkan juga di WSN berbasis pohon mengingat node
«  entri bukan nol; Teori CS menyatakan bahwa  dapat dipulihkan sumber termasuk dalam paketnya informasi penginderaan yang
dari = (  catatan(/ )) kombinasi linear dari pengukuran yang merupakan produk dari nilai yang diperoleh dan koefisien acak dan
diperoleh sebagai = , dimana adalah × matriks. kemudian mengirimkannya ke node hop berikutnya [30]. Dengan cara
Perhatikan bahwa, mengingat bahwa   adalah nilai yang kecil demikian, kompresi CS dapat dilakukan dengan kompleksitas yang
dibandingkan dengan , berikut ini   bisa jauh lebih kecil dari   dan rendah pada node sumber [9] dan lalu lintas data melalui
4 Jurnal Internasional Jaringan Sensor Terdistribusi

jaringan berkurang [8]. Namun, dalam kasus terakhir jumlah hop data kemudian dikompresi dengan kode yang mengidentifikasi bin
yang tinggi diperlukan, yaitu,= ( / ), yang dapat menyebabkan latensi unik tempat nilai sampel berada.
jaringan yang tinggi. Untuk lebih menjelaskan cara kerja DISCUS, mari kita perhatikan
Dalam [7], perbandingan teknik pemrosesan sinyal berbasis contoh sederhana.
CS dan konvensional untuk WSN telah dilakukan dalam hal Mari kita anggap bahwa pengukuran (terkuantisasi) berada dalam
efisiensi energi dan masa pakai jaringan. kisaran bilangan bulat [0, 7] dan bahwa semua data yang dirasakan dari
Namun, ada beberapa tantangan yang harus diatasi sensor yang berbeda pada (hampir) waktu yang sama paling banyak
untuk menggunakan CS: berbeda ±1. Tanpa kompresi DSC, tiga bit diperlukan untuk setiap sensor
untuk mewakili data sensorik. Sebaliknya, dalam kasus DSC hanya kepala
(i) Waktu decoding untuk rekonstruksi dapat menjadi ( 3) dan karena
cluster yang mengirimkan nilai tiga bit. Node sensor lainnya dapat
itu sangat mahal untuk jaringan besar. Ada algoritma yang lebih
membagi nilai yang mungkin menjadi empat tempat sampah {0, 4}; {1,
murah (misalnya, pencocokan pencarian) tetapi mereka
5}; {2, 6}; {3, 7}sehingga nilai dalam bin yang sama memiliki jarak
memberikan pemulihan yang kurang stabil dan batas kesalahan
minimum = 4 dan mengkodekannya, masing-masing, dengan {00}, {01},
yang lebih lemah dalam solusi yang dipulihkan.
{10}, {11}. Jadi jika sink menerima 01 dari node sensor, ia mengetahui
(ii) CS mengasumsikan bahwa data yang diindra memiliki sparitas bahwa hanya dua nilai yang mungkin, yaitu {1, 5}. Sekarang mari kita
konstan yang diketahui, mengabaikan bahwa sparitas sinyal anggap bahwa wastafel juga menerima nilai 6 (dikodekan dengan benar)
nyata bervariasi dalam domain temporal dan spasial. Secara dari kepala cluster; dalam hal ini, nilai 01 segera diinterpretasikan
khusus, dasar sparsifying diasumsikan diberikan dan diperbaiki sebagai 5 tanpa ambiguitas sebagai konsekuensi dari fakta bahwa data
dengan waktu, tetapi ini tidak berlaku untuk skenario WSN yang yang diindra dapat berbeda paling banyak 1.
realistis, di mana sinyal yang diinginkan tidak diketahui dan
karakteristik statistiknya dapat bervariasi dari waktu ke waktu.
Dalam contoh di atas, hanya kepala cluster yang mentransmisikan 3
bit untuk setiap pengukuran sedangkan untuk semua node lainnya
(iii) Teknik berbasis CS menimbulkan kerugian yang tidak dapat diabaikan cukup 2 bit; oleh karena itu, kompresi tercapai.
(kesalahan pemulihan) dengan mengurangi keandalan dan bekerja Namun, DSC bergantung pada asumsi bahwa karakteristik
paling baik untuk jaringan skala besar (setidaknya seribu node). statistik (yaitu, fungsi korelasi) dari data yang mendasarinya harus
(iv) Efek kuantisasi: Teori CS sebagian besar berfokus diketahui secara apriori, yang sulit diperoleh dalam skenario praktis.
pada pengukuran bernilai nyata tetapi dalam Misalnya, skema DISCUS sederhana yang dibahas di atas hanya
praktiknya pengukuran harus direpresentasikan berfungsi jika perbedaan antara nilai sampel oleh kepala cluster dan
dengan jumlah bit yang terbatas. Akibatnya, ada semua node lain dalam cluster yang sama kurang dari/2. Selain itu,
trade-off antara jumlah pengukuran  dan jumlah bit kehilangan informasi sampingan (yaitu, data kepala cluster) akan
per pengukuran  CS. menyebabkan kesalahan fatal pada dekoder, yaitu keandalan yang
rendah.
Dalam makalah ini, kami berkonsentrasi pada dua masalah terakhir, Cara sederhana untuk meningkatkan keandalan dicapai dengan
dengan menganalisis pengaruh sparsity dan kuantisasi pada penghematan mentransmisi ulang paket kepala klaster lebih banyak tetapi ini
energi dan keandalan. Rincian lebih lanjut tentang CS dan cara mengurangi efisiensi kompresi. Oleh karena itu, ada trade-off
mengeksploitasinya untuk WSN akan diberikan di bagian selanjutnya. antara konsumsi energi dan keandalan berdasarkan jumlah
transmisi ulang maksimum yang diizinkan. Dalam makalah ini, kami
3.3. Teknik Terkait Teori Informasi.Untuk mengeksploitasi menyelidiki pertukaran semacam itu.
korelasi data yang diperoleh secara bersamaan oleh sensor
yang berbeda, teknik DSC, yang terinspirasi oleh teorema 3.4. Teknik Jaringan
Slepian-Wolf, dapat diterapkan [2]. Teknik DSC menyiratkan
bahwa setiap node sensor mengirimkan output terkompresi ke 3.4.1. Teknik Berbasis Perutean.Karena transmisi radio adalah
sink untuk decoding bersama. Ini berarti bahwa node perlu sumber utama konsumsi daya di node, desain perutean hemat
bekerja sama dalam kelompok dua atau tiga sehingga satu energi adalah topik penting lainnya untuk diselidiki dalam
node menyediakan informasi samping dan yang lain dapat desain teknik pengumpulan data. Ide dasarnya adalah untuk
memampatkan informasinya ke batas Slepian-Wolf atau Wyner- merutekan paket melalui jalur sehingga meminimalkan
Ziv. Selanjutnya, pendekatan DSC juga sulit untuk diterapkan konsumsi energi secara keseluruhan untuk mengirimkan paket
dalam skenario seperti itu karena mereka bekerja dengan dari sumber ke tujuan. Masalah berfokus pada komputasi aliran
asumsi bahwa karakteristik statistik dari distribusi data yang dan daya transmisi untuk memaksimalkan masa pakai jaringan,
mendasarinya harus diketahui terlebih dahulu [9, 31]. yaitu waktu di mana node pertama dalam jaringan kehabisan
Implementasi DSC yang paling praktis dan terkenal adalah DISCUS energi [18]. Secara khusus, tingkat konsumsi energi per unit
[5, 32] di mana node sensor dianggap dibagi menjadi beberapa cluster. transmisi informasi untuk setiap node tergantung pada pilihan
Untuk setiap cluster, sebuah node (kepala cluster) mengirimkan data hop berikutnya, yaitu keputusan routing. Pilihan ini dapat
yang tidak terkompresi (sebagai informasi sampingan) sementara semua mempengaruhi energi yang dibutuhkan untuk mencapai sink
node lainnya mengirimkan data yang dikodekan (yaitu, dikompresi). [14].
Untuk mengkodekan data, node sensor terlebih dahulu membagi semua nilai Salah satu karya terbaru yang membahas masalah memaksimalkan
yang mungkin menjadi himpunan yang terpisah-pisah (bernama bin) sehingga nilai masa pakai jaringan dengan mempertimbangkan mekanisme perutean
dalam bin yang sama memiliki jarak minimum. . Setiap bagian dari sensorik adalah [17]. Penulis mencoba untuk mencapai keduanya
Jurnal Internasional Jaringan Sensor Terdistribusi 5

latensi rendah dan keandalan tinggi. Mereka membangun pohon memiliki kemampuan untuk meneruskan fungsi paket yang diterima
pengumpulan data berdasarkan model keandalan, menjadwalkan (misalnya, kombinasi linier). Dengan cara ini, keuntungan throughput,
transmisi data untuk tautan di pohon, dan menetapkan daya transmisi ke ketahanan, dan penghematan energi dapat dicapai dengan
setiap tautan yang sesuai. Namun, mereka tidak melakukan segala jenis memanfaatkan fakta bahwa setiap paket yang baru dihasilkan membawa
agregasi data atau kompresi data dengan tujuan tidak menimbulkan informasi yang terkandung dalam beberapa paket asli [39].
penundaan ekstra. NC telah mendapat perhatian yang meningkat juga di WSN sebagai
Agregasi data dapat dilakukan di atas algoritma perutean. alat yang menjanjikan untuk meningkatkan masa pakai dan keandalan
Fungsi agregasi biasanya dilakukan dengan mengekstrak jaringan dengan memanfaatkan sifat siaran saluran nirkabel [40].
beberapa nilai statistik (misalnya, maksimum, minimum, dan Namun, sebagian besar teknik yang diusulkan dikembangkan sejauh
rata-rata) dan kemudian hanya mentransmisikan ini [15]. ini [41-43], sementara berguna untuk penyebaran data (misalnya, lalu
Sedemikian rupa, dimungkinkan untuk mengurangi jumlah
lintas dari node sink ke node sensor), tidak dapat diterapkan untuk
komunikasi data dalam jaringan sensor padat dan mengurangi
pengumpulan data, yang merupakan lalu lintas terpenting di WSN. .
konsumsi daya. Namun, teknik ini kehilangan banyak struktur
data asli yang diperoleh.
Bahkan, untuk menerapkan NC untuk pengumpulan data di WSN, beberapa
Secara khusus, penulis [15] mempelajari masalah konstruksi
masalah harus diselesaikan.
hutan untuk memaksimalkan masa pakai jaringan. Mereka
mengadopsi model agregasi data sederhana dan mengasumsikan
(i) Header Overhead. Skema NC sebagian besar didasarkan
bahwa sensor perantara dapat menggabungkan beberapa pesan
pada kode linier acak [44, 45] yang memungkinkan
Bbit yang masuk, bersama dengan pesannya sendiri, menjadi satu
penerapannya secara terdistribusi tetapi memperkenalkan
pesan keluar. Selain itu, mereka menyediakan algoritma waktu
overhead yang besar karena koefisien yang digunakan untuk
polinomial untuk membangun pohon dan menunjukkan bahwa itu
kombinasi linier harus ditentukan dalam header paket. Ukuran
mendekati optimal.
header sebanding dengan jumlah paket agregat yang, dalam
Dalam [14, 33, 34], penulis mempertimbangkan masalah
kasus khusus pengumpulan data di WSN, bisa sama dengan
memaksimalkan masa pakai WSN dengan algoritma perutean dengan
jumlah node dalam jaringan.
menyusun kembali masalah ini sebagai masalah pemrograman linier
yang dapat diselesaikan dalam waktu polinomial. Algoritme yang (ii) Masalah Semua-atau-Tidak Sama sekali. Kapan  paket digabungkan
diusulkan adalah rute jalur biaya terpendek yang biaya tautannya menggunakan NC, wastafel harus menerima setidaknya   paket agar
merupakan kombinasi dari konsumsi energi transmisi dan penerimaan dapat memulihkan informasi asli. Jadi, bahkan jika wastafel menerima1
dan tingkat energi sisa pada dua simpul akhir. paket, itu tidak dapat memulihkan informasi apa pun. Sebaliknya,
Dalam [18], penulis mencoba untuk bersama-sama degradasi anggun diinginkan di WSN.
mengoptimalkan perutean dan agregasi data sehingga masa pakai
jaringan dapat diperpanjang dengan mempertimbangkan dua (iii) Keterlambatan. Penundaan yang diperkenalkan oleh NC mungkin
dimensi. Pada dimensi pertama, lalu lintas di seluruh jaringan menjadi penghalang untuk jaringan besar di mana sejumlah besar paket
dikurangi dengan agregasi data, sehingga dapat mengurangi harus digabungkan dan diterjemahkan. Sebaliknya, banyak aplikasi
konsumsi daya dari node yang dekat dengan node sink. Di dimensi jaringan sensor, misalnya, WSN yang dikembangkan untuk kontrol/
kedua, lalu lintas seimbang untuk menghindari node bottleneck otomatisasi atau streaming audio/video real-time, memerlukan
yang berlebihan. Fungsi smoothing digunakan untuk mendekati penundaan terbatas yang kecil.
fungsi maksimalisasi asli dengan mengeksploitasi struktur khusus
jaringan. Kondisi yang diperlukan dan cukup untuk mencapai (iv) Bersepeda Tugas. Sebagian besar skema NC didasarkan pada
optimalitas fungsi pemulusan ini diturunkan dan algoritma gradien pendengaran; yaitu, node harus tetap dalam mode aktif untuk
terdistribusi dirancang dengan tepat. berpartisipasi dalam perutean berbasis NC, yang meningkatkan
Yang dkk. mengusulkan dalam [35-37] desain bersama pengisian konsumsi energi node sensor. Jadi, sulit untuk menggabungkan
energi dan pengumpulan data dengan memanfaatkan mobilitas. SenCar, paradigma NC dan teknik duty-cycling yang biasa digunakan di
entitas seluler multifungsi, secara berkala memilih subset sensor untuk WSN.
dikunjungi berdasarkan status energinya. Ini menggunakan transmisi
(v) Keandalan. Keandalan penuh (atau setidaknya tinggi) diinginkan
energi nirkabel untuk mengirimkan energi ke sensor yang dikunjungi
dalam jaringan sensor dan wajib dalam beberapa skenario,
dan, sementara itu, mengumpulkan data dari sensor terdekat melalui
misalnya, dalam eksperimen ilmiah baru, di mana akurasi
komunikasi multihop jarak pendek dan dapat menyampaikan data ini ke
pengamatan sangat penting, atau dalam kasus aplikasi biomedis, di
sink.
mana perlu untuk memastikan bahwa rincian penting tidak hilang
menyebabkan kesalahan dalam diagnosis medis. Ketika kode acak
3.4.2. Teknik Berbasis Pengkodean Jaringan.Pendekatan yang
digunakan, bahkan dalam jaringan yang andal, pesan asli dapat
berbeda mengeksploitasi paradigma network coding (NC).
diambil dengan "probabilitas tinggi" (meskipun bukan "kepastian"),
NC adalah pendekatan transmisi informasi yang efektif yang dan probabilitas tinggi dicapai melalui penggunaan bidang terbatas
awalnya diperkenalkan oleh Ahlswede et al. [38] untuk yang besar (yaitu, koefisien besar dan karenanya header besar).
meningkatkan kapasitas jaringan jaringan multicast.
Berbeda dari paradigma jaringan store and forward klasik di
mana node hanya mereplikasi dan meneruskan paket yang (vi) Kompleksitas. Teknik NC harus sederhana untuk mengatasi
masuk, menggunakan node perantara NC dalam jaringan sumber daya komputasi dan memori node sensor yang rendah.
6 Jurnal Internasional Jaringan Sensor Terdistribusi

Kami merujuk pembaca ke [46] untuk pertimbangan lebih lanjut 4.1. Model Jaringan.Kami mengasumsikan WSN di mana
tentang penerapan NC ke WSN. wastafel terletak di tengah area ukuran persegi penginderaan ×
Masalah di atas telah dipecahkan di [16] di mana penulis [M2] dan node sensor didistribusikan secara acak dengan
mengusulkan teknik penerusan baru untuk WSN kepadatan [node/m2]. Setiap node sensor memiliki jangkauan
berdasarkan Teorema Sisa Cina (CRT) yang mampu transmisi yang sama dengan[m] (dengan /2) dan mengirimkan
mencapai pertukaran yang berbeda antara keandalan dan datanya ke sink melalui skema multihop.
penghematan energi. Jaringan dipartisi menjadi cluster yang tidak tumpang tindih
Pada dasarnya, CRT dapat dilihat sebagai teknik pemisahan menggunakan prosedur yang dijelaskan dalam [16, 49]. Prosedur yang
yang dapat mengubah bilangan bulat   ke dalam vektor bilangan disebutkan di atas terutama didasarkan pada pertukaran Pesan
yang lebih kecil bernama komponen CRT, {  }. Komponen CRT Inisialisasi (IM) dan memungkinkan pengorganisasian jaringan dalam
diperoleh dari nomor  menggunakan aritmatika modular sebagai    = kelompok meminimalkan jumlah hop yang dibutuhkan oleh node sensor
(mod  ), di mana    (dengan [1, . . . ,CRT]) adalah bilangan prima (atau untuk mencapai sink. Wastafel seharusnya milik cluster 1 (dilambangkan
setidaknya bilangan bulat coprime berpasangan). sebagai CL1) dan menghasilkan IM pertama dengan alamatnya sendiri
dan nomor urut SN = 2. Setiap node, yang menerima IM dari
CRT menyatakan bahwa setiap bilangan bulat   dapat diperoleh
tetangganya dengan nomor urut SN = , akan menjadi milik cluster CLℎ
kembali secara tepat dari komponen CRT-nya jika produk dari prime
dan akan mengirim ulang IM dengan nilai SN yang meningkat bersama
angka = CRT =1    memenuhi syarat
dengan alamatnya sendiri dan
(5) daftar node yang akan digunakan sebagai forwarder (yang diketahui sesuai
>
dengan alamat sumber yang ditentukan dalam IM yang diterima).
(selanjutnya dinamakan kondisi rekonstruksi). Secara khusus, Berdasarkan IM yang diterima, pada akhir prosedur di atas, setiap node
CRT selalu menyatakan bahwa  dapat dipulihkan melalui dalam jaringan akan mengetahui hop berikutnya sendiri dan node lain
kombinasi linier sederhana sebagai mana yang akan menggunakannya sebagai hop berikutnya. Rincian lebih
lanjut tentang prosedur inisialisasi adalah
CRT

=    (mod ). (6) dilaporkan di [49].


=1 Kami berasumsi bahwa prosedur inisialisasi di atas dilakukan
hanya satu kali sehingga kami mengabaikan konsumsi energi
Koefisien    diberikan oleh    =    ⋅   , di mana    = /   terkait.
dan    adalah kebalikan modularnya diperoleh dengan menyelesaikan      = Berikut ini, node di sepanjang jalur dari sumber ke sink
1 (mod   ). disebut sebagai: relayer dan node yang terletak satu hop
CRT dapat diterapkan di WSN untuk membagi paket yang dihasilkan dari sumber di sepanjang jalur ke sink secara khusus
oleh node sensor. Paket yang lebih kecil (yaitu, komponen CRT) dapat disebut relayer satu hop.
dikirim melalui jalur yang berbeda dengan memanfaatkan keragaman Kami berasumsi bahwa, terlepas dari teknik pengumpulan
jalur WSN. Fakta bahwa node relayer meneruskan paket yang lebih kecil data tertentu, relayer mengirimkan paket melalui a skema jalur
memungkinkan pengurangan konsumsi energi [47]. terpendek loadbalancing; yaitu, sebuah node dalam cluster CL+1
Selain itu, CRT memiliki beberapa keunggulan dibandingkan dengan akan memilih secara acak node yang dapat dijangkau di cluster
teknik NC lainnya: berikutnya menuju sink (CLℎ), dan skema penerusan ini diulang
sampai sink tercapai. Dengan cara ini, informasi mencapai sink
(i) Himpunan bilangan prima {  } dapat dipilih sehingga informasi
dengan jumlah hop minimum.
yang dihasilkan oleh node sensor dapat direkonstruksi bahkan
jika hanya sebagian kecil dari komponen CRT yang diterima oleh 4.2. Model Pengumpulan Data.Sampai saat ini, kami telah mengklasifikasikan
sink, dengan meningkatkan keandalan dan memecahkan teknik pengumpulan data berdasarkan teknik agregasi data yang digunakan.
masalah semua atau tidak sama sekali. Namun, teknik pengumpulan data dapat diklasifikasikan juga dengan
(ii) Berbeda dari koefisien yang digunakan untuk teknik NC, mempertimbangkan faktor-faktor yang mendorong perolehan data. Secara
himpunan bilangan prima dapat diperoleh langsung khusus, empat kategori luas dapat dibedakan [50]: berdasarkan peristiwa,
dengan sink (yaitu, CRT menghindari ledakan header). berdasarkan waktu, berbasis kueri, dan hibrida.
Dalam kategori yang digerakkan oleh peristiwa, data dihasilkan ketika
(iii) CRT dapat dikombinasikan secara efisien dengan
suatu peristiwa yang menarik terjadi, sedangkan dalam kategori yang
teknik duty-cycling [48] dan algoritma kompresi
digerakkan oleh waktu, data secara berkala dikirim ke wastafel pada interval
terdistribusi [19] untuk mencapai teknik agregasi
waktu yang konstan; dalam kategori berbasis kueri, data dikumpulkan sesuai
data yang efisien.
dengan permintaan sink. Akhirnya, pendekatan hibrida adalah kombinasi dari
Mempertimbangkan keuntungan di atas dan fakta bahwa makalah satu atau lebih hal di atas.
ini difokuskan pada teknik pengumpulan data untuk WSN, kami akan Untuk tujuan simulasi, dengan tujuan mengevaluasi konsumsi
mempertimbangkan CRT sebagai perwakilan dari teknik pengumpulan energi dan keandalan, semua kategori di atas dapat disatukan
data berbasis jaringan. dengan abstraksi konsep peristiwa, yaitu, hanya dengan
mempertimbangkan bahwa data harus dikirim sebagai konsekuensi
4. Skenario Simulasi dari suatu peristiwa.
Secara khusus, dalam jaringan berbasis kueri, suatu peristiwa dipicu oleh
Pada bagian ini akan dibahas model WSN yang digunakan penerimaan pesan kueri, sedangkan dalam jaringan yang digerakkan oleh
untuk perbandingan dan simulasi teknik pengumpulan data. waktu, peristiwa tersebut dapat dikaitkan dengan peningkatan
Jurnal Internasional Jaringan Sensor Terdistribusi 7

tepi jam dari unit pengambilan sampel atau, lebih praktis, ketika Jadi mengingat itu    node merasakan peristiwa tersebut, jumlah keseluruhan bit
jumlah pengukuran yang cukup telah dikumpulkan dan paket siap yang ditransmisikan untuk setiap peristiwa ketika DSC digunakan adalah
untuk ditransmisikan.
Mempertimbangkan abstraksi di atas, konsumsi energi dan
  
keandalan jaringan dapat dievaluasi dalam hal jumlah peristiwa (yaitu, DSC =  ,DSC+ (  - 1) . (8)
paket yang dikirim) dengan tidak memperhitungkan siapa yang DSC
mendorong peristiwa tersebut.
(iii) CS. Kami berasumsi bahwa header sel mengumpulkan paket dari
Oleh karena itu, dalam skenario simulasi kami, kami akan
node lain di sel yang sama dan mengirimkannya dengan
mempertimbangkan bahwa  V peristiwa secara acak terjadi di jaringan
menerapkan CS. Lebih tepatnya, langkah-langkah yang
sensor dan bahwa, untuk setiap peristiwa,    node mengenali acara dan
dikumpulkan dapat diwakili oleh matriksx dari    × nilai-nilai dari -bit
menghasilkan paket. Lebih tepatnya, kami berasumsi bahwa hanya
masing-masing di mana  kolom ke- x  mewakili langkah-langkah
simpul di dalam area lingkaran jari-jari, dengan pusat di lokasi acara,
yang diambil oleh    node hampir bersamaan. Mempertimbangkan
mendeteksi acara dan karena itu perlu mengirim paket. Selanjutnya,
bahwa nilai-nilai tersebut sangat berkorelasi baik dalam ruang dan
kami menyebut area melingkar yang terkait dengan suatu peristiwa
waktu dengan mengambil transformasi yang tepat, kami
sebagai sel.
memperoleh vektor jarang dengan probabilitas tinggi. Misalnya, kita
Dalam jaringan yang digerakkan oleh peristiwa, biasanya paket-paket
dapat mengasumsikan bahwa DCT diterapkan pada setiap vektor
kecil dikirim untuk menentukan bahwa suatu peristiwa telah terdeteksi (satu -
kolomx  dan hanya itu   Koefisien DCT akan menjadi bukan nol.
sedikit kata bisa cukup dalam banyak kasus). Alih-alih dalam kasus jaringan
Dalam hal ini kepala sel perlu mengirim= (  catatan(  / )) pengukuran
berbasis waktu atau berbasis kueri, paket mewakili  langkah-langkah yang
untuk setiap kolom, yaitu,  ⋅  pengukuran untuk setiap kejadian.
dikumpulkan dalam interval waktu antara dua peristiwa. Kedua kasus dapat
diperhitungkan mengingat bahwa untuk setiap peristiwa informasi mentah Untuk tujuan simulasi, kami menganggap bahwa
dari   bit harus dikirim untuk setiap node dengan memperbaiki = 1 untuk pengukuran CS diwakili oleh  CS bit dan pengukuran tersebut
jaringan yang digerakkan oleh peristiwa dan 1 dalam kasus jaringan berbasis dikirim melalui   paket dari  CS =   ⋅  CS bit masing-masing
waktu atau berbasis kueri. melalui skema jalur terpendek penyeimbang beban.
Dengan tujuan mengurangi konsumsi energi (yaitu, jumlah Jadi jumlah keseluruhan bit yang ditransmisikan oleh kepala sel untuk
keseluruhan bit yang dikirim), data mentah tidak langsung setiap kejadian saat CS digunakan adalah
ditransmisikan; sebaliknya, data diproses sesuai dengan teknik
pengumpulan data yang dipilih. CS =   CS =    CS. (9)
Lebih tepatnya, kami memiliki yang berikut ini.
Pilihan lain dimungkinkan tanpa mengubah jumlah keseluruhan
(i) TEC. Node yang menggunakan teknik TEC memanfaatkan korelasi bit yang ditransmisikan  CS; misalnya, kita bisa mempertimbangkan 
temporal untuk mengurangi jumlah bit. paket dari   ⋅  CS bit, tetapi pilihan sebelumnya akan
Di sini kami tidak mempertimbangkan teknik TEC tertentu tetapi menyederhanakan perbandingan. Secara khusus, kami akan
menganggap bahwa faktor kompresi,  TEC, dari teknik TEC yang menunjukkan bahwa dengan hasil perbandingan pilihan di atas
digunakan diketahui. Akibatnya, kita dapat menyatakan bahwa akan independen dari  jadi hasil kami akan valid untuk kedua event-
menggunakan teknik TEC setiap bagian dari data mentah-bit akan driven (= 1) dan didorong oleh waktu/permintaan (1) teknik.
direpresentasikan setelah kompresi dengan  TEC = / TEC bit dan untuk
setiap peristiwa node harus mentransmisikan  TEC = / TEC (iv) CRT. CRT dieksploitasi seperti yang ditunjukkan pada [16].

bit. Jadi mengingat itu   node merasakan peristiwa tersebut, jumlah keseluruhan bit Secara khusus, kami menganggap bahwa untuk setiap peristiwa   
yang ditransmisikan untuk setiap peristiwa ketika TEC digunakan adalah node sumber mengirim paket mereka ke satu set umum relayer satu hop
bernama Relay CRT. Untuk selanjutnya, kami tunjukkan dengan CRT itu
   
TEC =    TEC = . (7) number of CRT relayers.
TEC
As in the case of CS, the collected measures can be represented
As already stated, we assume that packets are transmitted by a matrix x dari    × nilai-nilai dari -bit masing-masing di mana  
through a load-balancing shortest-path scheme; that is, a node kolom ke- x  represents the measures taken by   
in cluster CL+1 akan memilih secara acak node yang dapat nodes almost at the same time.
dijangkau di cluster berikutnya menuju sink (CLℎ), and this CRT relayers process the data of each column x  in two
forwarding scheme is repeated until the sink is reached. In this steps:
manner, information reaches the sink with the minimum
number of hops. (1) In the first step, received data are compressed with a
compression algorithm by obtaining a binary
(ii) DSC. According to DISCUS, we assume that only one node sequence  .
for each cell (henceforward named the cell head) sends (2) In the second step, CRT is applied to improve
uncompressed measures (i.e., side information) into a reliability by splitting the binary sequence   so that
packet of    bits while all the other nodes send compressed each CRT relayer forwards a CRT component.
packets of   DSC =   / DSC bits. Also in this case we assume that
all packets are transmitted through a load-balancing It is worth noting that each CRT relayer will independently
shortestpath scheme. However, to improve reliability we compress the received packets by obtaining the same sequence
assume that the cell head transmits its packets  ,DSC times. . This is possible mainly because as they receive the
8 Jurnal Internasional Jaringan Sensor Terdistribusi

same data set and apply the same compression algorithm, the considering  1, . . . ,    obtained from quantization of continuous
compressed sequence   obtained is the same for all relayers. Gaussian variables  1, . . . ,   , the joint entropy is [51]
Henceforward, we indicate by    the length of the
compressed sequence  . ( 1, . . . ,   ) = ℎ ( 1, . . . ,   )
CRT relayers split the binary sequence   they have (11)
1
constructed and forward it. Specifically, the sequence   is = log2 (( 2  )    ⋅ |Σ|) ,
2
interpreted as an integer    = Σ =0
 −1
   ⋅2  (di mana    are bits of
 )and by properly choosing the set of prime numbers {  } where |Σ|, known as generalized variance, is the determinant of
each CRT relayer calculates and forwards the corresponding the covariance matrix Σ and ℎ(⋅) is the differential entropy
CRT component    =    (mod   ). (rigorously speaking, we have to distinguish between
Note that ⌈log2(  )⌉ is the number of bits needed to differential entropy ℎ( ) for a continuous source   (i.e., before the
represent   , so the overall number of bits transmitted by the A/D conversion) and Shannon’s information entropy  ( ) for a
CRT relayers is discrete source   (i.e., after quantization introduced by the A/D
conversion); however, it is straightforward to prove that their
CRT values coincide when unitary quantization step is
CRT =   ∑ ⌈log2 (  )⌉ . (10) considered, as done in this paper). In particular for Gaussian
=1 sumber dengan koefisien korelasi yang sama ρ  dan
varians σ2, varians umum adalah |Σ| =σ2 [1+( −1) ] (1− )1
Dari teori CRT, sink akan dapat merekonstruksi dan oleh karena itu
semua pengukuran mentah dari komponen CRT
asalkan kondisi rekonstruksi puas (yaitu,
Π CRT = catatan2 (2   (1 ) )
=1    2  ).
Perhatikan bahwa kondisi rekonstruksi dapat dipenuhi oleh (12)
1 + (  1) ) .
beberapa himpunan bilangan prima; namun, untuk mengurangi jumlah + catatan2 (√
bit yang diperlukan untuk merepresentasikan nilai  , dan oleh karena itu 1 
jumlah keseluruhan bit yang dikirim, lebih disukai untuk memilih
himpunan bilangan prima terkecil, yang kita sebut sebagai Himpunan Selain itu, mengingat bahwa untuk rentang nilai
Prima Minimum (MPS). yang luas (yaitu, ρ  [0, 0,99], 8) istilah kedua diabaikan,
Misalnya, jika  CRT = 4 dan    = 40, MPS akan menjadi {1019, maka
1021, 1031, 1033}. Faktanya, ini adalah himpunan empat
bilangan prima berurutan terkecil yang memenuhi hubungan ≈   catatan2 (2   (1 ) ) . (13)
Π CRT
=1    240.
Oleh karena itu, faktor kompresi lossless ideal (maksimum) untuk
Namun, ketika himpunan bilangan prima dipilih seperti di atas,
variabel Gaussian dengan mempertimbangkan blok   nilai berkorelasi
pesan dapat direkonstruksi jika dan hanya jika semua komponen
dari -bit masing-masing dapat diperoleh sebagai
CRT diterima dengan benar oleh sink. Jadi, untuk memperhitungkan
kemungkinan kerugian karena media nirkabel yang tidak dapat ⋅   
,ideal = = .
diandalkan, kami menggunakan MPS dengan  kegagalan yang dapat   (14)
diterima (MPS ), yaitu, himpunan bilangan prima terkecil berturut-
catatan2 (2   (1 ) )
turut yang memenuhi kondisi rekonstruksi bahkan jika   Komponen
CRT hilang. Seperti yang ditunjukkan pada [16], ketika  ,  CRT, dan   Sepanjang makalah ini, kami berasumsi bahwa

diperbaiki, MPS   set unik sehingga relai CRT dapat memperoleh


MPS   secara terdistribusi. DSC =  TEC =  ,ideal (15)

(yaitu, faktor kompresi lossless maksimum). Akibatnya,


4.3. Model Sumber.Seperti yang ditunjukkan pada [13] dan referensi kita memiliki
di dalamnya, perbedaan antara dua sampel berurutan dari
beberapa data dunia nyata (suhu, kelembaban, radiasi matahari, DSC =  TEC = catatan2 (2   (1 ) ) . (16)
dll.) cocok dengan distribusi Gaussian. Jadi, dalam makalah ini kami
mempertimbangkan data penginderaan itu   didekati dengan
Mengenai CS, faktor kompresi sebenarnya terkait
distribusi Gaussian dan berkorelasi baik dalam ruang dan waktu.
dengan tingkat sparsity = /   nyatanya
Pilihan ini juga dimotivasi oleh fakta bahwa beberapa hasil
analisis terkenal untuk distribusi Gaussian dan dapat dengan mudah       1
dimanfaatkan untuk mendapatkan faktor kompresi lossless CS = = ⋅ . (17)
 CS  CS 2  catatan (1/ ) + (5/4) + 1
maksimum untuk sumber Gaussian yang berkorelasi.
Seperti diketahui ketika kompresi sumber diskrit Perhatikan bahwa  CS adalah fungsi menurun dari .
dipertimbangkan, entropi Shannon   memberikan batas Jadi kami mempertimbangkan dua kasus: tingkat sparsity yang ideal  ideal
kompresi lossless. seperti yang  CS =  ,ideal dan nilai yang sedikit lebih besar    = 1.2ideal.
Untuk data berkorelasi Gaussian, di bawah asumsi yang sesuai Akhirnya dalam kasus CRT kami menganggap bahwa algoritma
dan tanpa kehilangan keumuman, dapat ditunjukkan bahwa, MinDiff sederhana yang diusulkan dalam [4] digunakan untuk kompresi.
Jurnal Internasional Jaringan Sensor Terdistribusi 9

Pada dasarnya, MinDiff mengkodekan satu set data yang tidak di mana    adalah energi yang dihabiskan oleh sebuah node untuk mentransmisikan
terkompresi = {  } dengan kumpulan data terkompresi lainnya = { ,1 satu bit dan    adalah jumlah keseluruhan bit yang ditransmisikan dengan
, . . . , }, di mana = min {  } adalah nilai minimum dalam   dan    apakah mempertimbangkan teknik pengumpulan data spesifik yang diturunkan dalam
perbedaannya?    =    - μ diwakili dengan    = kancatatan2(maks {  } + 1) Bagian 4 (lihat (7)–(10)).
⌉ bit masing-masing. Misalnya, dalam kasus pengumpulan data berbasis
Jumlah bit    diperlukan untuk mewakili himpunan TEC adalah  TEC =     TEC =   / TEC dan sebagai akibatnya,
perbedaan dan nilai μ diperlukan untuk rekonstruksi yang
tepat dan oleh karena itu biaya overhead + catatan2( ) bit 1
ERFTEC = 100 (1 ). (21)
harus dipertimbangkan. TEC
Oleh karena itu, faktor kompresinya mempertimbangkan blok   nilai-nilai
dari -bit masing-masing dapat diperoleh sebagai
Namun, dalam kasus jaringan lossy, jumlah bit yang
dikirim dan diterima berbeda dan yang diharapkan
⋅ 
,perbedaan kecil =
. (18) faktor reduksi energi harus dinyatakan dengan mempertimbangkan
+ catatan2 () +  memperhitungkan jumlah bit yang sebenarnya diteruskan.
Untuk tujuan perbandingan, kami memutuskan untuk mengevaluasi
4.4. Model Energi.Demikian pula untuk pekerjaan lain (misalnya, [16, 19]), energi mempertimbangkan node milik cluster 2 (yaitu, CL2).
kami mempertimbangkan model energi sederhana di mana untuk setiap Kami membatasi analisis kami ke node dari cluster kedua
bit yang akan ditransmisikan, sebuah node menghabiskan energi yang karena dua alasan. Pertama, node ini adalah yang paling kritis
sama dengan   . Tampaknya, model tersebut mengabaikan energi yang karena mewakili tetangga sink. Bahkan, jika node ini kehabisan
dibutuhkan untuk komputasi dan penerimaan tetapi ini tidak benar jika energi, wastafel tetap terisolasi. Kedua, umur jaringan
kita merenungkan fakta bahwa dalam jaringan sensor jumlah bit yang didefinisikan sebagai waktu sampai node pertama dalam
ditransmisikan, jumlah bit yang diterima, dan jumlah operasi jaringan mati dan dengan probabilitas tinggi, jika tidak pasti,
pemrosesan yang semua sebanding dengan jumlah ukuran yang node ini milik CL2 mengingat bahwa semua pesan dirutekan ke
dirasakan. Jadi energi yang dibutuhkan untuk komputasi dan sink melalui node ini.
penerimaan dapat dengan mudah dimasukkan ke dalam  . Akhirnya, mengingat masa pakai jaringan terkait dengan energi
Sebagai contoh, mari kita anggap bahwa sebuah node untuk maksimum yang dikonsumsi oleh sebuah node dalam makalah ini,
penginderaan dan pemrosesan   langkah-langkah dari   bit kami juga menyelidiki faktor reduksi energi yang terkait dengan
membutuhkan energi yang sama dengan    ⋅    dan itu, menggunakan energi maksimum:
teknik kompresi yang tepat dengan faktor kompresi sama dengan   , ini
mengurangi jumlah bit yang akan ditransmisikan dari   ke /  . Dalam hal RAW, maks -  ,maksimal .
ERF,maksimal = (22)
ini, energi keseluruhan adalah   ⋅    + (/  )   yang dapat kita tulis ulang RAW, maks
sebagai (  /  )  mempertimbangkan    =      +    .
Terakhir, jika juga energi yang dibutuhkan untuk penerimaan Mengenai keandalan, kami menganggap bahwa sebuah
harus disertakan dan berbeda dengan energi yang digunakan untuk node gagal meneruskan paket dengan probabilitas    dan
transmisi, mengingat untuk hampir semua node jumlah bit yang evaluasi rasionya  , antara jumlah pengukuran mentah yang
diterima sama dengan jumlah bit yang ditransmisikan, itu akan diperoleh oleh sink dan jumlah pengukuran mentah yang
cukup untuk digunakan.    =      +     +    . dihasilkan dari node sumber atau, setara,
Oleh karena itu, penyederhanaan utama yang diperkenalkan
hilang,  ,
oleh model kami adalah bahwa kami mempertimbangkan    jarak- ,= 1 (23)
independen; yaitu, kami tidak menganggap itu    dapat diubah ⋅   
secara adaptif oleh lapisan MAC berdasarkan jarak antara node
di mana  hilang,  adalah jumlah pengukuran mentah yang hilang
sumber dan tujuan.
karena kesalahan jaringan dan/atau rekonstruksi.
,TEC dapat dengan mudah diperkirakan dengan mengasumsikan teknik
5. Metrik Kinerja decoding yang sempurna di mana semua data yang diterima didekodekan
dengan benar oleh sink.
Untuk memperkirakan efisiensi energi dari teknik di atas, mari
Sebenarnya jika ℎ adalah jumlah hop yang diperlukan untuk mencapai
kita perkenalkan: Faktor reduksi energi, ERF , yang mewakili
wastafel dan    adalah probabilitas bahwa sebuah node gagal meneruskan a
persentase pengurangan energi yang dihabiskan menggunakan
teknik pengumpulan data tertentu (  ) dibandingkan dengan
paket, peluang paket hilang adalah    = 1−(1−  )ℎ
dan oleh karena itu jumlah data yang hilang yang diharapkan adalah  hilang, TEC
kasus ketika ukuran mentah langsung dikirim ( MENTAH). Metrik
=      . Sebagai konsekuensi
ini didefinisikan sebagai

MENTAH -   , hilang, TEC = 1  = (1 )ℎ .   ⋅   


ERF  = 100 (19) ,TEC = 1 (24)
MENTAH

di mana {TEC, CS, CRT, DCS}. Perhatikan bahwa keandalan teknik TEC hanya terkait dengan
Ketika jaringan lossless yang ideal dipertimbangkan, ERF  parameter jaringan    dan ℎ dan tidak dapat ditingkatkan tanpa
dapat dinilai sebagai
mengandalkan teknik pengkodean saluran (misalnya, FEC).
    ⋅    -    ⋅    , Berbeda dari teknik TEC, untuk semua teknik pengumpulan
ERF,ideal = 100 (20)
    ⋅    data lainnya, keandalan dapat ditingkatkan dengan a
10 Jurnal Internasional Jaringan Sensor Terdistribusi

1
PR,TEC (Pe = 0,01)
nM = 10

1 0.9
nM = 100
0.9
0.8 PR,TEC (Pe = 0,05)
0,7 0.8
PR,CRT

0.6

PR,DSC
nM = 10
0,5
0.4
0,3 0,7
0.2 nM = 100
0.1
60 0.6
50 6
40 5
4
NCR 30 3
T 20 2 F 0,5
10 0 1 1 2 3 4 5 6
nR,DSC
Gambar 1:  ,CRT untuk nilai yang berbeda  CRT dan   Kapan    = 0,04.
nM = 10, pe = 0,05 N nM = 10, pe = 0,01 N
M = 100, pe = 0,05 M = 100, pe = 0,01

pengaturan parameter desain yang tepat. Namun demikian, ada tradeoff


Gambar 2:  ,DSC untuk nilai yang berbeda   ,  ,DSC, dan    Kapan = 4.
antara keandalan dan penghematan energi seperti yang dibahas secara
singkat di bawah ini.

(i) CRT. Dalam kasus bilangan prima pengumpulan data CRT, angka dapat di mana  hilang, DSC adalah jumlah paket yang hilang dengan memperhitungkan
dipilih sehingga semua ukuran mentah dapat direkonstruksi bahkan jika bahwa semua paket yang terkait dengan kejadian yang sama akan hilang jika
paling banyak  Komponen CRT hilang. tidak ada paket kepala sel yang datang. Perhatikan bahwa yang diharapkan
Seperti yang ditunjukkan pada [16], ketika   tetap, keandalannya dapat
Nilai dari  hilang, DSC adalah  hilang, DSC  =     ,DSC + (   - 1)(1
diperkirakan sebagai
 ,DSC)  .
 
 
   CT R -  , Pada Gambar 2, kita dapat membandingkan keandalan TEC dan
,CRT = ( CRT)  (1 ) (25) DSC untuk dua nilai yang berbeda dari probabilitas kerugian per
=0  
hop (   = 0,01 dan    = 0,05) dan jumlah hop yang tetap, = 4, ketika
nilai yang berbeda  ,DSC dan jumlah node sumber yang berbeda   
di mana    = 1 (1 )ℎ adalah probabilitas bahwa komponen
dipertimbangkan.
CRT hilang.
Sebagai aturan umum, keandalan yang tinggi dapat diperoleh dengan
Karena mungkin untuk mengamati dengan
memperbaiki   sehingga =CRT   +    di mana    adalah konstanta kecil pada
memperbaiki  ,DSC = 3 kita punya  ,DSC ≥  ,TEC untuk berbagai   
dan    (yaitu,    {0,01, 0,05} dan    {10, 100}). Perhatikan juga
urutan dari √ CRT  .
bahwa semakin meningkat  ,DSC tidak membaik  ,DSC sekali.
Hasil ini dapat dibenarkan dengan mempertimbangkan bahwa  ,CRT (melihat
Hal ini dapat dibenarkan mengingat, untuk nilai tinggi,
(25)) dapat didekati dengan fungsi distribusi kumulatif
yaitu,  ,DSC → , berikut ini  ,DSC 1 (  - 1)  /   =
dari variabel normal dengan mean  CRT   dan varians  
1  +   /   ≈  ,TEC.
CRT  (1 ).
Jelas, kehandalan meningkat dengan jumlah retrans-
Misalnya, pada Gambar 1 kami menunjukkan keandalannya  ,CRT
misi  ,DSC tetapi dengan biaya mengurangi penghematan energi.
untuk nilai yang berbeda  CRT dan   Kapan    = 0,04. Seperti yang
Jadi di bagian selanjutnya kami menyelidiki trade-off antara
mungkin untuk diamati, nilai-nilai kecil dari (misalnya, = 6)
keandalan dan konsumsi energi untuk nilai yang berbeda dari
cukup untuk mencapai nilai reliabilitas yang tinggi (>0.99).
,DSC.
Keandalan yang lebih tinggi dapat diperoleh dengan lebih
meningkatkan nilai parameter . Namun, dengan meningkatkan  
(iii) CS. Dengan menunjukkan dengan  jumlah paket yang dikirim dengan CS,
konsumsi energi juga meningkat sehingga pada bagian selanjutnya
kemungkinan untuk menerima setidaknya  * paket adalah
kami menyelidiki trade-off antara keandalan dan konsumsi energi
untuk nilai yang berbeda dari . - *  
-  .
CS = ( )  (1 ) (27)
(ii) DSC. Juga dalam kasus DSC, probabilitas untuk kehilangan a =0  
paket adalah    = 1 (1 )ℎ. Namun, tindakan kompresi DSC tidak Oleh karena itu, dengan meningkatkan   itu mungkin untuk menjamin
dapat dipulihkan jika informasi sampingan (yaitu, paket yang
itu, dengan probabilitas yang diinginkan  CS, paling sedikit  * paket
dihasilkan oleh kepala sel) tidak diterima.
diterima oleh sink. Sebagai aturan umum, keandalan yang tinggi
Jadi, untuk meningkatkan keandalan, kami menganggap bahwa
dapat diperoleh dengan memperbaiki  sehingga =*/(1− ) + , di mana   
kepala sel mentransmisikan  ,DSC kali informasi samping.
adalah konstanta kecil.
Dalam hal ini, keandalan DSC dapat dievaluasi sebagai:
Namun, berbeda dari semua teknik sebelumnya, keandalan
hilang, DSC , CS tidak hanya terkait dengan jumlah paket yang diterima
,DSC = 1 (26)
   sehingga  CS, yang selanjutnya disebut keandalan jaringan, bukan
Jurnal Internasional Jaringan Sensor Terdistribusi 11

keandalan CS yang sebenarnya (ini membenarkan mengapa kami menggunakan notasi 100
CS dari pada  CS). Faktanya, teknik CS didasarkan pada algoritma
rekonstruksi yang dapat menyebabkan kesalahan sehingga nilai 80
yang direkonstruksi ?̂?  bisa berbeda dari data mentah asli   .
Namun demikian, jika kita mengasumsikan bahwa data mentah    adalah
nilai terkuantisasi (seperti biasa di WSN di mana ukuran mentah berasal dari 60

ERF
ADC), kita dapat menyatakan bahwa tindakan terkuantisasi dapat dipulihkan
dengan tepat jika kesalahan rekonstruksi |?̂?  -   | lebih kecil dari kesalahan 40
kuantisasi /2, dimana  adalah langkah kuantisasi yang digunakan untuk
kuantisasi   .
Oleh karena itu, dalam simulasi kami, kesalahan rekonstruksi, 20
|?̂?  -   |, dievaluasi untuk setiap ukuran dan data mentah dianggap
hilang jika kesalahan ini lebih besar dari /2. 0
Dari sudut pandang simulasi, keandalan CS yang sebenarnya dapat 8 16 32 64
dievaluasi sebagai: σ
hilang, CS , TEC
,CS = 1 (28) TECMODEL
⋅    DSCMODEL DSC
CRTMODEL CRT
di mana  hilang, CS adalah jumlah tindakan yang hilang dengan
CSIMODEL CSI
mempertimbangkan baik packet loss maupun kesalahan rekonstruksi.
CS2MODEL CS2
Kami menunjukkan di bagian selanjutnya bahwa dengan
memilih  CS = + 3 dan =*/(1 ) + 2 kita dapat memperoleh  ,CS 1. Parameter Simulasi
Dua algoritma rekonstruksi dipertimbangkan untuk CS dalam ρ 0.1
makalah ini: rekonstruksi ideal (yaitu, berbasis oracle), di mana R 55M
R 18M
posisi tepat dari nilai bukan nol diasumsikan diketahui pada node
Pe 0
sink, dan CoSaMP [27]. Untuk membedakan di antara mereka, kami ρC 0,55
menunjukkan keandalannya sebagai ,CSI dan  ,CoSaMP, masing- M 50
masing. F 0
nR,DSC 1
M M*
6. Hasil Simulasi
Gambar 3: ERF teknik pengumpulan data dalam hal jaringan
Di bagian ini, kami membandingkan teknik pengumpulan data
yang andal (   = 0), varian rendah ({8–64}), dan korelasi
dalam hal konsumsi energi dan keandalan. sedang (ρ  = 0,55).
Hasil telah diperoleh melalui simulator C++ kustom. Untuk
setiap set parameter, hasil rata-rata dilaporkan dengan
mempertimbangkan 20 topologi acak di mana node berada Hasil yang sama diperoleh untuk nilai yang berbeda , yaitu,
terdistribusi secara merata dalam luas persegi 600×600 [M2], dengan mengubah jumlah ukuran mentah per paket. Ini dapat
dengan kepadatan [node/m2]. Kami juga berasumsi bahwa V dengan mudah dibenarkan oleh fakta bahwa MENTAH =       
peristiwa secara acak terjadi di cluster yang jauh (misalnya, CL5 dan    =      keduanya sebanding dengan   jadi rasio mereka dan
sehingga = 4 hop diperlukan untuk mencapai wastafel) dan setiap oleh karena itu juga ERF (lihat (19)) tidak tergantung pada . Jadi
peristiwa dideteksi oleh    = ρπ 2 node sumber (di mana   adalah hasil simulasi untuk nilai yang berbeda   tidak ditampilkan demi
radius indra). ruang.
Jika tidak dinyatakan lain,  V = 300 peristiwa dipertimbangkan Berdasarkan hasil sebelumnya, kita dapat menyatakan bahwa dalam
dan data mentah diwakili dengan = 12 bit (yang merupakan nomor kasus jaringan yang andal TEC dan DSChave ERF yang lebih besar dan oleh
khas untuk ADC yang digunakan dalam jaringan sensor). karena itu tampaknya mereka harus lebih disukai daripada teknik
pengumpulan data lain yang dianalisis. Namun, seperti yang ditunjukkan pada
6.1. ERF dengan Jaringan yang Handal.To asses the bagian berikutnya, hasil ini tidak benar ketika keandalan menjadi masalah.
simulator we first analyzed an ideal (fully reliable) WSN and
evaluated the ERF for different values of   and    when Perhatikan bahwa dalam simulasi kami ERFDSC dan ERFTEC
different data gathering techniques (TEC, CRT, DSC, and CS) hampir sama karena kami menetapkan nilai yang sama untuk
are considered. In particular, for CS two cases have been koefisien korelasi spasial dan temporal. Jelas, ketika korelasi
considered: an ideal case (CSI) where the sparsity level   =  /   spasial dan temporal tidak sama, hasil yang berbeda dapat
is fixed to the minimum value   =  ideal such that   ,CS =   ,ideal ( diperoleh.
see (17) and (14)) and a second case (CS2) where a slightly Akhirnya, perhatikan bahwa meskipun CRT tampaknya menjadi yang
greater value    = 1.2 ⋅  ideal is used. terburuk dalam hal ERF, ini adalah satu-satunya teknik pengumpulan
As shown in Figures 3 and 4, the results obtained through data di mana algoritma kompresi yang sebenarnya (MinDiff) telah
the analytical model (see (20)) and those reported by the dipertimbangkan (untuk semua teknik lainnya, faktor kompresi yang
simulator are very close to each other for all the values of   and    ideal telah diasumsikan). Jadi hasil simulasi sebelumnya memungkinkan
considered. These results confirm the validity of our model. kuantifikasi penalti dalam menggunakan kompresi sederhana
12 International Journal of Distributed Sensor Networks

100 100

80 80

60 60

ERF
ERF

40 40

20 20

0 0
32 64 128 256 8 16 32 64
   

TECMODEL TEC TECMODEL TEC


DSCMODEL DSC DSCMODEL DSC
CRTMODEL CRT CRTMODEL CRT
CSIMODEL CSI CSIMODEL CSI
CS2MODEL CS2 CS2MODEL CS2

Simulation Parameters Simulation Parameters

  0.1   0.1
R 55m R 55m
r 18m r 12m
pe 0 pe 0
 c 0.97  c 0.55
M 50 M 50
f 0 f 0
Nr,DSC 1 Nr,DSC 1
m m∗ m m∗

Figure 4: ERF of data gathering techniques in the case of reliable Figure 5: ERF of data gathering techniques in the case of reliable
network (   = 0), high variance (  ∈ {32–256}), and high correlation network (   = 0) and lower sensing radius (  = 12).
(   = 0.97).

without altering the overall number of source nodes (i.e.,


algorithm (MinDiff) instead of more complex techniques (at   =   ⋅   ⋅  2 = 45 in both cases).
least when Gaussian data are considered).
By comparing Figures 3 and 5, we can see that CRT and CS 6.2. ERF with Unreliable Networks. In Figures 7 and 8,
achieve different values of ERF when the sensing radius,  , reliability and ERF of data gathering techniques for    = 0.01
changes. In particular, ERFCSI is no more able to reach the same and different values of   are reported.
values of ERFDSC for low values of  .
On the basis of the simulation results, we can state that
This can be justified considering that when   decreases, even in the case of unreliable networks TEC and DSC have
the sparsity level   ∝ 1/   increases, and, as a consequence, greater ERF (see Figure 8). However, their reliability is fully
the compression factor  CS decreases too (see (17)). determined by the packet loss probability and cannot be
It is worth nothing that our analytical model is able to improved; instead, by using CRT and CS higher reliability can
anticipate this result. be achieved by increasing   and  , respectively.
Also in the case of CRT, the ERF slightly decreases for In particular, as shown in Figure 7, by fixing   = 8 a
lower values of   due to the fact that when    decreases the reliability higher than 0.975 can be achieved for CRT and
overhead of the MinDiff algorithm is more relevant and   , even higher values can be obtained using CS when   =  ∗/(1 −  
MinDiff is not able to approach   ,ideal (see (18)).
) + 2 CS measures are sent.
Similar considerations can be made about the node
It is important to note that the reliability plotted for CS is the
density  . In fact, as it is possible to observe by comparing
actual reliability obtained after reconstruction with an ideal
Figures 3 and 6, ERFCSI and ERFCRT decrease for lower values
(oracle-based) reconstruction algorithm (i.e.,   ,CSI and
of   (i.e., lower values of   ).
It is worth noting that Figures 6 and 5 report quite similar not   ,CS).
ERF values despite different values of   and   being used for By choosing   so that   =  ∗/(1 −   ) + 2, we have
simulation. This result can be justified by considering that with high probability (i.e.,   ,CS > 0.99) that the sink receives at
network density and sensing radius have been changed but least  ∗ CS measures, that is, the minimum number of
International Journal of Distributed Sensor Networks 13

100 1

0.995
80
0.99

0.985
60
0.98

PR
ERF

40 0.975

0.97
20 0.965

0.96
0 8 16 32 64
8 16 32 64  
 
TEC TECMODEL
TECMODEL TEC DSC DSCMODEL
DSCMODEL DSC CRT CRTMODEL
CRTMODEL CRT CSI
CSIMODEL CSI CS2
CS2MODEL CS2
Simulation Parameters
Simulation Parameters   0.1
  0.045 R 55m
R 55m r 18m
r 18m pe 0.01
pe 0  c 0.55
 c 0.55 M 50
M 50 f 8
f 0 Nr,DSC 3
Nr,DSC 1 m m∗/(1 − pn) + 2
m m∗
Figure 7: Reliability of data gathering techniques for    = 0.01.
Figure 6: ERF of data gathering techniques in the case of reliable
network (   = 0) and lower density (  = 0.045).
CS and sparsity levels when   = 12. Simulation parameters are
those reported in Figure 3.
measures sufficient for reconstruction, and therefore original As it is possible to observe, when  CS < 15 reliability
measurements can be perfectly recovered (so that   ,CS = 1). In quickly decreases.
the next subsection, we will show that this is true only if  CS =   + Similar results have been obtained for different values of
3, as chosen for our simulations.  .
Obviously, high reliability is achieved at the cost of a lower However, inpractice, actual reliability depends also on the
ERF but, by comparing Figures 8 and 3, we can state that the reconstruction algorithm used. For the sake of completeness,
impact on the ERF is quite low (both ERFCRT and ERFCS we report in Figure 10 CS reliability when the CoSaMP [27]
decrease by a few percent). algorithm is used for reconstruction.
As it is possible to observe also in this case  CS = 15 is
As a consequence when high reliability is needed even with
needed for achieving high reliability. Nevertheless, perfect
unreliable networks, CRT and CS should be preferred.
reliability is not obtained with CoSaMP when   =  ∗. So in
some cases CRT could be preferred to CS because reliability
6.3. CS Reliability. In all the previous simulations, we have can be better predicted.
fixed the number of bits  CS used for representing quantized
CS measures equal to   + 3. A careful reader could observe
6.4. ERF    and Network Lifetime. The ERF metric is an
that this choice is questionable and that by reducing  CS
expression of mean energy consumptions; instead, network
higher values of ERFCS can be obtained. This consideration is
lifetime ismore closely related tomaximumenergy
partially true: effectively, ERFCS increases for lower values of  CS, consumptions.
but our simulation results show that using values of  CS In Figure 11, we report ERFmax instead of ERF for different
below  +3 is not possible to have perfect reconstruction (i.e., data gathering techniques. ERFmax is evaluated on the basis of
 ,CS = 1). (22), that is, considering the maximum energy consumptions for
To convince the reader in Figure 9, we report simulation nodes belonging to cluster CL2. Maximum energies have greater
results about the actual reliability   ,CS for different values of variations in comparison to mean values so in order
14 International Journal of Distributed Sensor Networks

100 1

80 0.8

60 0.6

PR,CS
ERF

40 0.4

20 0.2

0 0
8 16 32 64 8 16 32 64
   

TECMODEL TEC CSI (bCS = 15) CoSaMP (bCS = 14)


DSCMODEL DSC CoSaMP (bCS = 15) CoSaMP (bCS = 13)
CRTMODEL CRT
CSI Figure 10:   ,CoSaMP for different values of  CS and  .
CSIMODEL
CS2MODEL CS2
100
Simulation Parameters
  0.1
R 55m 80
r 18m
pe 0.01
 c 0.55 60
ERFmax

M 50
f 8
3 40
Nr,DSC
m m∗/(1 − pn) + 2

Figure 8: ERF of data gathering techniques for    = 0.01. 20

0
8 16 32 64
1  
0.99
TEC CSI
0.98 DSC CS2
0.97 CRT
0.96 Simulation Parameters
PR,CS

0.95   0.1
0.94 R 55m
r 18m
0.93 pe 0.01
0.92  c 0.55
M 50
0.91 8
f
0.9 Nr,DSC 3
13 14 15 m m∗/(1 − pn) + 2
bCS
Figure 11: ERFmax of data gathering techniques for    = 0.01.
CSI   = 8 CS2   = 8
CSI   = 16 CS2   = 16
CSI   = 32 CS2   = 32
CSI   = 64 CS2   = 64 As it is possible to observe, TEC and DSC have higher ERF
max and therefore greater network lifetime can be expected
Figure 9:   ,CSI for different values of  CS and sparsity levels when  
= 12. when DSC and TEC are used for data gathering.
Finally, note that CRT and CS have similar performance if
the actual sparsity degree of CS is 20% more than the
to have higher confidence we increased the number of events to minimum (ideal) value. These observations can be extended
V = 3000. also to all the previous simulations.
International Journal of Distributed Sensor Networks 15

7. Conclusions and Future Works ERF : Energy reduction factor of the data
gathering technique   ∈ {TEC, CS, DSC,
In this paper, we have compared several data gathering  : CRT} Reliability of the data gathering
techniques used in WSNs by using both simulation results and technique   ∈ {TEC, CS, DSC, CRT}
analytical models. In particular, the effectiveness of the above  : Minimum value within set {  }; that is,   =
techniques has been investigated in terms of reliability (packet min {  }
loss and reconstruction errors) and energy efficiency (i.e., ERF  : Difference with the minimum element of {  
and network lifetime) by systematically sampling the parameter }; that is,    =    −   Compressed sensing
space (i.e., number of nodes, transmission range, and sparsity).  : measurement Number of CS
Basically we can summarize our results as follows:  : measurements Minimum/sufficient
 ∗: number of CS measurements for
reconstruction
(i) DSC and TEC techniques should be preferred for
 : Number of nonzero components of a  -
maximizing network lifetime.
sparse signal
(ii) CS should be preferred when high reliability is  : Sparsity level of CS measurements; that is,  
needed. =  / 
 : Correlation coefficient of raw
(iii) CRT should be preferred for its inherent lowcomplexity.
measurements
 : Standard deviation of raw measurements
As a consequence, we can state that there is no best  : Maximum transmission distance (coverage
solution for all possible applications and that only the tradeoff radius)
between energy consumptions, reliability, and complexity  : Sense radius of a node
candrive the choice of the data gathering technique to be used CRT: Number of CRT relayers
for a specific application.  : Grid size (edge in meter)
As future work, we plan to refine and improve the model to  : Node density
deal with actual correlated measurements (i.e., not only  : Energy spent for each transmitted bit
Gaussian data) and more realistic propagation channels (i.e., by  : Shannon’s entropy
taking into account actual distance between nodes).  ,DSC: Number of retransmissions for the clus-
ter/cell head when DSC is used
CLℎ: Cluster number ℎ
Notations
ℎ: Number of hops between nodes in clusters
TEC: Transform and Encoding-Based CLℎ+1 and CLℎ
Compression  V: Number of events used for simulations.
CS: Compressive sensing
DSC: Distributed source coding Chinese Competing Interests
CRT: Remainder Theorem Generic data
 : gathering technique; that is,   ∈ {TEC, CS, The authors declare that they have no competing interests.
DSC, CRT}
= {  }: A set of uncompressed values (raw References
measurements)
 : Number of bits used to represent a raw [1] I. F. Akyildiz, W. Su, Y. Sankarasubramaniam, and E. Cayirci, “A
value (without compression) survey on sensor networks,” IEEE Communications Magazine,
 : Number of measurements/words per vol. 40, no. 8, pp. 102–105, 2002.
packet [2] Z. Xiong, A. D. Liveris, and S. Cheng, “Distributed source coding
 : Number of source nodes for sensor networks,” IEEE Signal Processing Magazine, vol. 21,
X: Matrix of    ×   raw data of  -bits each  th no. 5, pp. 80–94, 2004.
x : column of the matrix X (measures taken [3] D. Zordan, B. Martinez, I. Vilajosana, and M. Rossi, “On the
performance of lossy compression schemes for energy
by    nodes almost at the same time)
constrained sensor networking,” ACM Transactions on Sensor
Networks, vol. 11, no. 1, article 15, 2014.
 : Compression factor of the data gathering
[4] G. Campobello, O. Giordano, A. Segreto, and S. Serrano,
technique   ∈ {TEC, CS, DSC, CRT} Number
“Comparison of local lossless compression algorithms for
 : of bits used to represent a compressed
wireless sensor networks,” Journal of Network and Computer
measure with data gathering technique   Applications, vol. 47, pp. 23–31, 2015.
[5] J. Chou, D. Petrovic, and K. Ramachandran, “A distributed and
 : Number of bits per packet when data adaptive signal processing approach to reducing energy
gathering technique   is used Overall consumption in sensor networks,” inProceedings of the
 : number of bits transmitted for each 22ndAnnual Joint Conference of the IEEE Computer and
event when the data gathering Communications (INFOCOM ’03), vol. 2, pp. 1054–1062, IEEE,
technique   is used San Francisco, Calif, USA, March-April 2003.
16 International Journal of Distributed Sensor Networks

[6] X. He, X. Zhou, M. Juntti, and T. Matsumoto, “Data and error rate on Computing, Networking and Communications (ICNC ’15), pp.
bounds for binary data gathering wireless sensor networks,” 911–917, IEEE, Garden Grove, Calif, USA, Feburary 2015.
in Proceedings of the IEEE 16th International Workshop on Signal [23] F. Marcelloni and M. Vecchio, “An efficient lossless compression
Processing Advances in Wireless Communications (SPAWC ’15), pp. algorithm for tiny nodes of monitoring wireless sensor
505–509, Stockholm, Sweden, June 2015. networks,” The Computer Journal, vol. 52, no. 8, pp. 969–987,
[7] C. Karakus, A. C. Gurbuz, and B. Tavli, “Analysis of energy 2009.
efficiency of compressive sensing in wireless sensor networks,” [24] Y. Liang and W. Peng, “Minimizing energy consumptions in
IEEE Sensors Journal, vol. 13, no. 5, pp. 1999–2008, 2013. wireless sensor networks via two-modal transmission,” ACM
[8] H. Zheng, S. Xiao, X. Wang, X. Tian, and M. Guizani, “Capacity and SIGCOMMComputer Communication Review, vol. 40, no. 1, pp.
delay analysis for data gathering with compressive sensing in 12–18, 2010.
wireless sensor networks,” IEEE Transactions on Wireless
[25] S. S. Chen, D. L. Donoho, and M. A. Saunders, “Atomic
Communications, vol. 12, no. 2, pp. 917–927, 2013.
decomposition by basis pursuit,” SIAM Review, vol. 43, no. 1, pp.
[9] H. Zheng, F. Yang, X. Tian, X. Gan, X. Wang, and S. Xiao, “Data 129– 159, 2001.
gatheringwith compressive sensing inwireless sensor networks: a
[26] J. A. Tropp and A. C. Gilbert, “Signal recovery from random
random walk based approach,” IEEE Transactions on Parallel and
measurements via orthogonal matching pursuit,” IEEE
Distributed Systems, vol. 26, no. 1, pp. 35–44, 2015.
Transactions on Information Theory, vol. 53, no. 12, pp. 4655–
[10] L. Zhu, B. Ci, Y. Liu, and Z. D. Chen, “Data gathering in wireless sensor 4666, 2007.
networks based on reshuffling cluster compressed sensing,”
[27] J. A. Tropp and D. Needell, “CoSaMP: iterative signal recovery from
International Journal of Distributed Sensor Networks, vol. 2015, 13
incomplete and inaccurate samples,” Applied and Computational
pages, 2015.
Harmonic Analysis, vol. 26, no. 3, pp. 301–321, 2009.
[11] E. J. Candes andT. Tao, “Near-optimal signal recovery fromrandom
projections: universal encoding strategies?” IEEE Transactions on [28] E. Candes and M. Wakin, “An introduction to compressive
Information Theory, vol. 52, no. 12, pp. 5406–5425, 2006. sampling,” IEEE Signal Processing Magazine, vol. 25, no. 2, pp.
21–30, 2008.
[12] D. L. Donoho, “Compressed sensing,” IEEE Transactions on
Information Theory, vol. 52, no. 4, pp. 1289–1306, 2006. [29] V. Chandrasekaran, B. Recht, P. A. Parrilo, and A. S. Willsky, “The
convex geometry of linear inverse problems,” Foundations of
[13] T. Srisooksai, K. Keamarungsi, P. Lamsrichan, and K. Araki,
Computational Mathematics, vol. 12, no. 6, pp. 805–849, 2012.
“Practical data compression in wireless sensor networks: a
survey,” Journal of Network and Computer Applications, vol. 35, [30] X. Wang, Z. Zhao, Y. Xia, and H. Zhang, “Compressed sensing for
no. 1, pp. 37–59, 2012. efficient random routing in multi-hop wireless sensor
networks,” in Proceedings of the IEEE GLOBECOMWorkshops
[14] J.-H. Chang and L. Tassiulas, “Maximum lifetime routing in
wireless sensor networks,” IEEE/ACMTransactions on
(GC Wkshps ’10), pp. 266–271, IEEE, Miami, Fla, USA, December
2010.
Networking, vol. 12, no. 4, pp. 609–619, 2004.
[15] Y. Wu, Z. Mao, S. Fahmy, and N. B. Shroff, “Constructing [31] A. Razi, K. Yasami, and A. Abedi, “On minimum number of
maximum-lifetime data-gathering forests in sensor networks,” wireless sensors required for reliable binary source estimation,”
IEEE/ACM Transactions on Networking, vol. 18, no. 5, pp. 1571– in Proceedings of the IEEE Wireless Communications and
1584, 2010. Networking Conference (WCNC ’11), pp. 1852–1857, IEEE,
Cancun, Mexico, March 2011.
[16] G. Campobello, A. Leonardi, and S. Palazzo, “Improving energy
saving and reliability in wireless sensor networks using a simple [32] S. S. Pradhan and K. Ramchandran, “Distributed source coding using
CRT-based packet-forwarding solution,” IEEE/ACM Transactions syndromes (discus): design and construction,” in Proceedings of the
on Networking, vol. 20, no. 1, pp. 191–205, 2012. Data Compression Conference (DCC ’99), pp. 158–167, March 1999.

[17] D. Gong and Y. Yang, “Low-latency SINR-based data gathering in


wireless sensor networks,” IEEE Transactions on Wireless [33] J.-H. Chang and L. Tassiulas, “Routing for maximum system lifetime in
Communications, vol. 13, no. 6, pp. 3207–3221, 2014. wireless ad-hoc networks,” in Proceedings of the 37th Annual
[18] C. Hua and T.-S. P. Yum, “Optimal routing and data aggregation Allerton Conference on Communication Control and Computing, pp.
for maximizing lifetime of wireless sensor networks,” IEEE/ACM 1191–1200, Monticello, Ill, USA, September 1999.
Transactions on Networking, vol. 16, no. 4, pp. 892– 903, 2008. [34] J.-H. Chang and L. Tassiulas, “Energy conserving routing in wireless
ad-hoc networks,” in Proceedings of the 19th IEEE Annual Joint
[19] G. Campobello, S. Serrano, L. Galluccio, and S. Palazzo, “Applying Conference of the IEEE Computer and Communications Societies
the Chinese remainder theorem to data aggregation in wireless (INFOCOM ’00), vol. 1, pp. 22–31, March 2000.
sensor networks,” IEEE Communications Letters, vol. 17, no. 5, [35] S. Guo, Y. Yang, and C. Wang, “DaGCM: a concurrent data
pp. 1000–1003, 2013. uploading framework for mobile data gathering in wireless
[20] X. Xing, D. Xie, and G. Wang, “Energy-balanced data gathering sensor networks,” IEEE Transactions on Mobile Computing, vol.
and aggregating in wsns: a compressed sensing scheme,” 15, no. 3, pp. 610–626, 2016.
International Journal of Distributed Sensor Networks, vol. 2015, [36] S. Guo, C. Wang, and Y. Yang, “Joint mobile data gathering and
Article ID 585191, 10 pages, 2015. energy provisioning in wireless rechargeable sensor networks,”
[21] C. Lim, “Network coding for severe packet reordering in multihop IEEE Transactions on Mobile Computing, vol. 13, no. 12, pp.
wireless networks,” International Journal of Distributed Sensor 2836–2852, 2014.
Networks, vol. 2015, Article ID 379108, 9 pages, 2015. [37] M. Zhao, J. Li, and Y. Yang, “A framework of joint mobile energy
[22] M. Rossi, M. Hooshmand, D. Zordan, andM. Zorzi, “Evaluating the replenishment and data gathering in wireless rechargeable
gap between compressive sensing and distributed source sensor networks,” IEEE Transactions on Mobile Computing, vol.
coding in WSN,” in Proceedings of the International Conference 13, no. 12, pp. 2689–2705, 2014.
International Journal of Distributed Sensor Networks 17

[38] R. Ahlswede, N. Cai, S.-Y. R. Li, and R. W. Yeung, “Network


information flow,” IEEE Transactions on Information Theory, vol.
46, no. 4, pp. 1204–1216, 2000.
[39] C. Fragouli, J.-Y. Le Boudec, and J. Widmer, “Network coding: an
instant primer,” ACM SIGCOMMComputer Communication
Review, vol. 36, no. 1, pp. 63–68, 2006.
[40] P. Ostovari, J. Wu, and A. Khreishah, Network Coding Techniques
for Wireless and Sensor Networks, Springer, Berlin, Germany,
2013.
[41] S. Chachulski, M. Jennings, S. Katti, and D. Katabi, “Trading
structure for randomness in wireless opportunistic routing,”
ACM SIGCOMMComputer Communication Review, vol. 37, no. 4,
pp. 169–180, 2007.
[42] I.-H. Hou, Y.-E. Tsai, T. F. Abdelzaher, and I. Gupta, “AdapCode:
Adaptive network coding for code updates in wireless sensor
networks,” in Proceedings of the 27th IEEE Communications
Society Conference on Computer Communications (INFOCOM
’08), pp. 2189–2197, Phoenix, Ariz, USA, April 2008.
[43] Z. Yang, M. Li, and W. Lou, “R-code: network coding based
reliable broadcast in wireless mesh networks with unreliable
links,” in Proceedings of the IEEE Global Telecommunications
Conference (GLOBECOM ’09), pp. 1–6, IEEE, Honolulu, Hawaii,
USA, November 2009.
[44] T. Ho, R. Koetter, M. Medard, D. R. Karger, T. Ho, and M. Effros,
“The benefits of coding over routing in a randomized settings,”
in Proceedings of the IEEE International Symposium on
Information Theory, Yokohama, Japan, July 2003.
[45] T. Ho, M. Medard, R. Koetter et al., “A random linear network
coding approach to multicast,” IEEE Transactions on
Information Theory, vol. 52, no. 10, pp. 4413–4430, 2006.
[46] T. Voigt, U. Roedig, O. Landsiedel, K. Samarasinghe, and M.
B. Prasad, “On the applicability of network coding in wireless
sensor networks,” ACM SIGBED Review, vol. 9, no. 3, pp. 46– 48,
2012.
[47] G. Campobello, A. Leonardi, and S. Palazzo, “On the use of
Chinese remainder theorem for energy saving inwireless sensor
networks,” in Proceedings of the IEEE International Conference
on Communications (ICC ’08), pp. 2723–2727, Beijing, China,
May 2008.
[48] A. Leonardi, G. Campobello, S. Serrano, and S. Palazzo, “Tradeoffs
between energy saving and reliability in low duty cycle wireless
sensor networks using a packet splitting forwarding technique,”
EURASIP Journal on Wireless Communications and Networking, vol.
2010, Article ID 932345, 2010.
[49] G. Campobello, A. Leonardi, and S. Palazzo, “A novel reliable and
energy-saving forwarding technique for wireless sensor
networks,” in Proceedings of the 10th ACM International
Symposium on Mobile Ad Hoc Networking and Computing
(MobiHoc ’09), pp. 269–278, New Orleans, La, USA, May 2009.
[50] T. A. A. Alsbouı́, M. Hammoudeh, Z. Bandar, and A. Nisbet, “An
overview and classification of approaches to information
extraction in wireless sensor networks,” in Proceedings of the
5th International Conference on Sensor Technologies and
Applications (SENSORCOMM ’11), pp. 255–260, IARIA, Nice,
France, August 2011.
[51] T. M. Cover and J. A. Thomas, Elements of Information Theory,
Wiley-Interscience, New York, NY, USA, 1991.

Anda mungkin juga menyukai