星期五, 5月 08, 2009

SAS proc contents

手邊的資料有多個變數,要寫個程式檢查一下。
希望呈現的結果是變數的名稱 格式 與 樣本數 遺漏值
google到些關於proc contents的SUGI
研究整理一下 寫出符合自己需要的程式

分析經常會遇到有許多變數 特別是大規模的調查
研究設計者也都會盡可能的多蒐集資訊
變數"成百上千"是相當常見的
同時變數當中遺漏值的情形也更為常見
對於分析來說 知道變數與遺漏值的情形
是分析初期很重要的工作

數據(data)指著三件事情
一是數據的名稱(data name)
二是數據中的變數(data variable)
三是數據中變數的值(variable value)
分析時 能一次呈現這三種東西應有助於分析者對於資料的了解

stata當中有 describe (簡寫des) codebook指令可以呈現上述的動作
sas也可以從proc contents來作簡單的呈現
我接觸sas雖然較早 但是也是最近才開始用proc content
stata的資料檢查指令相對來說方便清楚很多

寫到這邊 我開始思考
為何我堅持要寫的sas程式來完成
(可能要寫上百行+參考一堆資料+修改試驗多次)
stata用2個指令就能完成的事情


目前遭遇的第一步困難就是
SAS proc contents呈現的結果
out時會依照變數的名稱依字母順序排序
而非依照原來再數據中的狀況排序
雖然有position這選項可以在output中呈現變數原來順序
但是 ODS html (結果另存網頁檔 可以匯到excel)還是不太行
我摸索看看



--
人土土金金金

沒有留言: