星期五, 10月 21, 2016

留下紀錄


留下紀錄

要方便再檢視

減少檢視的時間與程序

所以要是 blog好還是 evernote 好哩

還是想啥都好

星期三, 10月 19, 2016

R pdf to text


# here is a part for mining/ mate analysis

path0<-"N:\\Dropbox\\R study\\meta study\\mfolder"
mfolder <- file.path("N:\\Dropbox\\R study\\meta study\\mfolder")

path1 <- "N:\\Dropbox\\KMU\\Machine Learning meta-analysis\\Meta-analysis papers\\Traditional meta-analysis\\Example 1(Anticoagulants in CKD)"

m1folder <-file.path(path1)

mfolder
length <- length(dir(mfolder))
length
dirpdf <- dir(mfolder)
dirpdf[1]

# set path to pdftotxt.exe and vonvert odf to text

pdftotext <- "C:\\xpdfbin-win-3.04\\bin64\\pdftotext.exe"
for ( i in 1: length(dir(mfolder)) ) {
        pdf <- file.path(path0,dirpdf[i])
        system(paste("\"",pdftotext,"\" \"",pdf,"\"",sep = ""), wait=F)
}

星期日, 9月 04, 2011

那個審查

那些弄醫療倫理/藥物安全 為了不要發生傷害的事件 
不斷建構 龐雜的行政程序 一段一段可以分割責任的組織架構 
讓整個行為的成本不斷的加高 只是要降低傷害 降低風險

至於那些 因為等不到新藥開發 等不到行政程序審核過的人 
反正他們沒有聲音 他們不會抗議
(本來就沒有那個藥 本來就是要審查n天 本來就是... 
一堆被人弄出來的"本來") 
等不到的人難以被量化 沒有聲音 
了不起被認為只是邏輯上存在 實際上連個統計數字都不是

建構/維持程序的人 還能以保護受試者不被傷害 就好像保護弱小的英雄 
還可以 有著霸佔預算的權力 待遇良好的工作 
(審查程序很有趣 不斷列出可能的情形 然後要別人負責就行
出事了自己不用負責任 連把時間/行政成本墊高的責任都不用負)
只要夠聰明都知道怎麼選 

至於那些被迫要經歷這體制的 
需要新藥 需要新的研究成果 需要經過審查的
就算你肯負擔風險 說自行負責也沒關係的
(專家會說 你們沒有專業 資訊不足 不能判斷 好像是無知孩童一樣
連 賭一下的機會 都不會給你低~) 就怪自己運氣不好唄

想找人為你辯護/整取權力? 
放心 那些人會被認為是 科學狂人  沒有人會理他們的


人生在世 聰明跟運氣 滿重要的
(我真的滿偏激的)


星期三, 11月 10, 2010

其實還是不知道

已經有段時間 一直在擔心自己是不是適合的人
不敢不想去嘗試 也把這個當作是偷懶的藉口
現在開始換個想法 把這樣的質疑當作是種動力
 
反正 適不適合 自然有市場機制 來告訴你
要勉強也勉強不來
只是一直這樣疑惑 鬱悶著 也不是個解決的方式
 
PS 考慮把椅子搬回+買桌機

星期一, 3月 29, 2010

吹風機

最近吹風機怪怪的,感覺應該是快要掛了。
之前搬離高雄之前 紋欽有說過說這臺吹風機從大一祝宿舍的時候就在用
在高雄快10年一直陪著我 還有許多共用者(不要問 很恐怖)

仔細想想 其實 高中 甚至國中之前 就有用這台吹風機的印象

看著他越來越微弱 好像一個老人
無力的咳著 T.T

感覺 應該撐不了多久...

心情 悶悶的 (嗯 我不會哭出來的 )

星期三, 9月 23, 2009

我的被動

最近幾週經常提不動力分析 可能許多邏輯卡住/碰壁
不是倦怠而已 根本就像是逆境!!
但是 這時候開始有人來問資料 程式 等等


卻反而很有動力回答人家
甚至也因為這樣更有動力去分析東西

我開始擔心 如果我自己一個人 進行分析
會不會因為 沒有人來問我一下
變得走不長久
看來 我還是不是那種能獨自完成分析的人阿

這樣被動的情形實在很糟糕
沒有為自己著想
要做別人的事情
不用負責的事情 才會比較有動力
自己的事情就會 拖阿拖的

沒有目標 被動 甚至就這樣放棄的行為
真是糟糕阿
這跟我之前告誡自己的
怠惰 懶散 希冀僥倖 好像是差不多的齁

為何我就不能享受那種競爭的感覺
再實力相近的較量當中 激發出自己的潛能
就要躲在一旁
伺機出手

莫非 這就是我習慣(最適合)的戰略
還是我就已經適應這樣的競爭模式勒

雖然 我喜歡那種敗中求勝 令人刮目相看的感覺
但是 開始就把場面搞得很難看 這好像不太好齁






--
人土土金金金

星期五, 7月 17, 2009

sas index製作 可取代耗時耗資源的proc sort

週五要報告進度 週四寫好程式
想說讓他在伺服器跑一個晚上 應該能跑好
早上上班整理就能過關 沒想到早上一來 就是斷線的消息~

工作以來資料量越來越大
學生時期 還在說 超過1G 的資料很難處理
現在 都是上百G的...

進度要報告的原始資料 大概是17G左右
看過幾百G的時候 就覺得10幾G不算啥
而且要用的變數也不多 所以刪減之後 也不過1G左右
所以 寫程式也沒有多擔心~

但是!! 程式當中還是有幾個排序的動作
SAS PROC SORT這個超花時間的程序
就是他!!  當學生的時候
總是可以寫完程式 就看日劇 電影 打三國無雙
玩完之後 數據也大概整理好了

現在上班 沒有這些東西阿!!!
我還是要裝忙(誤)

唉 本來已經想跟老闆投降說 做不出來了
後來想想之前 老闆的前助理有講過INDEX這東西
可以幫資料創一個號碼
執行起來 比PROC SORT快很多

我也找過相關資料研究一下
有技術文件說 大概只要1/3的時間 就能完成PROC SORT的動作
但是 做好INDEX之後 要怎麼SET MERGE卻沒有說清楚

現在 遇到這麻煩了 只好死馬當活馬醫
試試看 不成熟的INDEX

結果 技術文件騙人
不只可以省3倍時間 省更多!!!
(應該是 硬體技術成長了 技術文件 是在奔騰2的CPU環境
現在隨便都是雙核心)

所以 嗯 就能交差了~~大心

列一下 INDEX製作的語法

PROC datasets library=資料夾名稱;/*暫存的就寫WORK*/
modify 數據名城;
index create 變數;/*要排序單一變數時*/
index create 包裹排序變數代號=(變數1 變數2 變數3....);/*要排序多個變數時*/
RUN;

如果要merge
直接寫merge的語法就行了

merge 數據1 數據2;by 變數;

還有個變化型
例如 常用proc sort nodupkey 來排除重複值的
也可以利用

index產生後
寫一段
if 變數=lag(變數) then delete;
這樣就能達到相同的效果( 時間上快很多)





--
人土土金金金