SAS Program
SAS Program
Dokumen ini memberikan ikhtisar tentang prosedur dan laporan SAS SAS pemrograman.
Isi
DATA langkah
Sebuah langkah DATA menciptakan dataset SAS (kumpulan data bersama-sama dengan "kamus data",
yang mendefinisikan variabel dan sifat mereka). Data harus dalam bentuk dataset SAS sebelum dapat
dianalisis dengan prosedur SAS.
Dalam contoh program SAS, garis-garis ini membuat KELAS Dataset dari input data mentah:
DATA KELAS;
INPUT NAMA $ $ UMUR BERAT SEX TINGGI;
KARTU;
JOHN M 12 59,0 99,5
JAMES M 12 57,3 83,0
... (Baris data lebih)
PROC langkah
Langkah Prosedur panggilan prosedur SAS untuk menganalisis atau proses dataset SAS.
Dalam contoh program SAS, garis-garis ini panggilan kedua SAS prosedur untuk menganalisis dataset
CLASS:
PROC PRINT;
PROC BERARTI;
VARIABEL BERAT TINGGI;
Sebuah program SAS dapat berisi sejumlah DATA dan langkah-langkah PROC. Laporan SAS di setiap
langkah yang dijalankan bersama-sama. Setelah dataset telah dibuat, dapat diproses oleh DATA
berikutnya atau langkah PROC.
SAS pernyataan
Semua pernyataan SAS mulai dengan kata kunci (DATA, INPUT, PROC, dll)
Semua SAS pernyataan diakhiri dengan tanda titik koma (;). (Masalah yang paling umum siswa jumpai
adalah menghilangkan titik koma - SAS berpikir bahwa dua pernyataan tersebut hanya satu.)
Laporan SAS dapat dimasukkan dalam format bebas: Anda dapat mulai di setiap kolom, beberapa
pernyataan mengetik pada satu baris atau split pernyataan tunggal atas beberapa baris (selama tidak
ada kata berpisah.).
Huruf besar dan huruf kecil adalah sama, kecuali dalam tanda kutip (seks = 'm', adalah tidak sama
dengan seks = 'M';).
SAS Prosedur
Prosedur SAS ada untuk melaksanakan semua bentuk analisis statistik. Seperti contoh di atas
menunjukkan, prosedur dipanggil dalam "langkah PROC" yang dimulai dengan kata kunci PROC, seperti:
Pernyataan VAR atau VARIABEL dapat digunakan dengan semua prosedur untuk menunjukkan variabel
harus dianalisis. Jika pernyataan ini diabaikan, default adalah untuk memasukkan semua variabel dari
tipe yang tepat (karakter atau numerik) untuk analisis yang diberikan.
Beberapa pernyataan lain yang dapat digunakan dengan langkah-langkah SAS kebanyakan prosedur
adalah:
Sebagai contoh, baris berikut menghasilkan berarti terpisah untuk pria dan wanita, dengan variabel SEX
berlabel 'gender'. (Sebuah pernyataan ID tidak tepat, karena hanya menghasilkan BERARTI PROC
keluaran ringkasan.)
Jika DATA = Pilihan ini tidak digunakan, prosedur SAS proses dataset yang terakhir dibuat. Dalam
ringkasan singkat di bawah ini, bagian diperlukan langkah PROC akan ditampilkan dalam huruf tebal.
Hanya beberapa perwakilan pilihan yang akan ditampilkan.
Statistik Deskriptif
PROC Corr
Korelasi antara set variabel.
PROC FREQ
Tabel frekuensi, chi ² tes
PROC BERARTI
Berarti, deviasi standar, dan sejumlah statistik univariat lain untuk satu set variabel.
Pilihan statistik pada PROC pernyataan yang BERARTI menentukan statistik dicetak. Pernyataan
OUTPUT (opsional) digunakan untuk membuat dataset SAS yang mengandung nilai-nilai statistik ini.
PROC univariat
Univariate statistik dan menampilkan untuk satu set variabel.
Model linear
Pernyataan SAS dan pilihan untuk regresi (PROC REG) dijelaskan secara lebih rinci dalam dokumen
Ringkasan PROC REG. Pernyataan SAS dan pilihan untuk analisis varians (ANOVA dan proc proc GLM)
yang dijelaskan dalam dokumen PROC ANOVA dan PROC GLM.
PROC ANOVA
Analisis varians (desain seimbang)
PROC GLM
Umum linier model, termasuk ANOVA, regresi dan analisis model kovarians.
PROC REG
Analisis regresi
BAGAN PROC
Histogram dan grafik batang
BAGAN PROC DATA = SASdataset pilihan;
VBAR variabel / pilihan;
HBAR variabel / pilihan;
pilihan: titik tengah = GROUP = SUMVAR =
PROC PLOT
Scatter plot
Perhatikan bahwa bentuk kurung di plot PLOT setiap pernyataan y-variabel yang terdaftar terhadap
setiap variabel x-.
Utilitas prosedur
PROC CETAK
Cetak set SAS Data
PROC SORT
Urutkan data SAS diatur sesuai dengan satu atau lebih variabel.
1 - 8 karakter
dimulai dengan A-Z atau _ (underscore)
tidak boleh berisi kosong atau simbol-simbol khusus (misalnya, &,%, $, #, dll)
SAS variabel:
Langkah DATA
SAS DATA langkah adalah digunakan untuk membuat atau proses dataset SAS. Sebuah langkah DATA
dapat membaca data mentah (pernyataan INPUT), atau data dari dataset SAS yang ada (SET
pernyataan). Fitur kunci dari langkah DATA adalah ini: SAS melakukan semua pernyataan pada langkah
DATA agar setiap pengamatan masukan.
Beberapa (banyak) pernyataan yang dapat digunakan dalam langkah DATA adalah:
DATA
Para statememt DATA sinyal awal dari sebuah langkah DATA dan nama dataset (s) yang akan dibuat.
INPUT
Pernyataan INPUT menentukan bagaimana data mentah harus dibaca. Daftar masukan membaca data
dalam format bebas. Cukup daftar nama-nama variabel Anda, dalam urutan mereka muncul pada baris
data. Sebuah tanda $ setelah nama variabel apapun menunjukkan bahwa variabel harus dibaca sebagai
karakter.
Kolom masukan membaca data dalam kolom tertentu. Menggunakan input kolom ketika data Anda
tidak dipisahkan oleh kosong, untuk membaca bidang karakter lebih dari 8 karakter, atau ketika Anda
tidak ingin membaca semua informasi pada setiap baris data.
INPUT NAMA $ 1-8 SEKS USIA $ 13-14 November TINGGI BERAT 16-19 22-25;
SET
Pernyataan SET membaca pengamatan dari dataset SAS yang ada. Pernyataan ini hanya membuat
salinan dari dataset CLASS.
Data newclass;
mengatur kelas;
Tugas
Pernyataan penugasan menciptakan variabel-variabel baru atau perubahan variabel yang ada. Semua
operasi aritmatika biasa, dan banyak SAS fungsi dapat digunakan.
** Exponentiation Y = X ** 2;
* Perkalian AREA = LEN * WIDTH;
/ KEPADATAN Divisi = MASSA / VOLUME;
+ Penambahan HARGA = BIAYA + Markup;
- BIAYA Pengurangan = HARGA - markup;
JIKA
Pernyataan IF digunakan untuk pengolahan bersyarat.
JIKA ekspresi
KEMUDIAN pernyataan;
ELSE pernyataan;
Pernyataan ELSE adalah opsional. JIKA ... KEMUDIAN bagian terdiri dari pernyataan tunggal. Sebagai
contoh,
Operator perbandingan SAS ditunjukkan di bawah ini. Anda dapat menggunakan baik simbol atau
singkatan dua huruf.
Simbol abbrev
<, <= LT, LE kurang dari, kurang dari atau sama
>,> = GT, GE lebih besar dari, lebih besar dari atau sama
=, ^ = EQ, NE sama, tidak sama
Suatu bentuk khusus dari pernyataan IF digunakan untuk subsetting dataset. Untuk mengekstrak laki-
laki dari dataset CLASS:
DATA Pria;
SET KELAS;
JIKA SEX = 'M';
Komentar
Dua jenis komentar: pernyataan comment (* ...;) dan hal-hal comment (/ * ... * /) Pernyataan
Komentar (seperti semua pernyataan SAS) harus diakhiri dengan titik koma. Hal dapat muncul di mana
saja komentar kosong tunggal dapat muncul. Komentar akan ditampilkan tebal pada contoh di bawah.
Perhatikan bahwa seluruh pernyataan diperlakukan sebagai komentar.
Data kelas;
* Baca dalam variabel;
masukan nama $ seks $ umur berat badan tinggi badan;
/ * Abaikan pernyataan berikutnya
umur = umur + 3;
*/
SAS fungsi
SAS berisi beberapa ratus fungsi yang dapat digunakan dalam langkah DATA. Berikut adalah beberapa
yang lebih umum digunakan.
ABS (x)
Nilai absolut, | x |.
EXP (x)
Eksponensial, e x; EXP (1) = 2,71828183 ....
INT (x)
Truncate x untuk integer; INT (3,145) = 3.
LOG (x)
Logaritma natural, log e (x); LOG (10) = 2,30258509 ....
Log10 (x)
Umum logaritma, log 10 (x); log10 (10) = 1.
MOD (x, d)
Sisa jika x dibagi oleh d; MOD (10,3) = 1.
ROUND (num)
ROUND (num, unit)
Angka bulat ke bilangan bulat terdekat (atau unit tertentu terdekat); ROUND (3,678) = 4; ROUND
(3,678, 0,1) = 3,7.
SQRT (x)
Menghitung akar kuadrat dari x.
NORMAL (biji)
Kembali nomor acak yang terdistribusi normal
SERAGAM (biji)
Kembali seragam [0,1] nomor acak.
Koleksi lain fungsi menghitung statistik SAS berbagai pengamatan tunggal di satu set variabel (bukan
seluruh pengamatan, seperti dalam BERARTI PROC). Untuk masing-masing, argumen dapat daftar nama
variabel, dipisahkan oleh koma, atau kata kunci DARI diikuti dengan daftar variabel SAS. Fungsi-fungsi
semua mengabaikan data yang hilang: hasilnya dihitung dari non-nilai yang hilang.
Contoh
Contoh di bawah ini membaca data KELAS variabel yang ditetapkan, dan menciptakan beberapa variabel
tambahan dengan pernyataan pemrograman DATA langkah.
DATA KELAS;
INPUT NAMA $ $ UMUR BERAT SEX TINGGI;
Jika usia <13 maka kelompok = 'praremaja';
kelompok lain = 'remaja';
logwt = log10 (berat); / * mengubah variabel * /
rootht = sqrt (tinggi);
KARTU;
JOHN M 12 59,0 99,5
JAMES M 12 57,3 83,0
... (Baris data lebih)
http://www.psych.yorku.ca/lab/sas/sasprog.htm