近開始整理之前的研究檔案,其中一個retrospective cohort study所收集到的實驗與對照組人數落差太大,對照組是試驗組的10倍以上。為了減少研究的落差,可以採用Propensity score matching的方式。以下有兩個方法透過python來處理: #1 Propensity score matching: 參考:matched pairs in Python (Propensity score matching) from sklearn.preprocessing import StandardScalerfrom sklearn.neighbors impor …
Python
-
-
使用 statsmodel 建立GEE #統計 #GEE #Python#Statsmodel 前言 在Python中有個強大的統計套件statsmodel,可以讓我們用Python做出可以比擬R以及一些統計軟體的效果。 最近因為研究需要,去學習了GEE(Generalized estimating equation – Wikipedia)。詳細的GEE原理與應用場景,大家可以參考:[12.1 – Introduction to Generalized Estimating Equations | STAT 504]、[Getting Started with …
-
好用的python 符號運算套件:Sympy 初探 最近努力學習數學,常用到一些工具來協助學習,其中python一個強大的套件幫助很大,這邊介紹ㄧ下。 特點 這個sympy 套件,可以實現符號運算。有幾個特點: 可以呈現符號運算過程,用Latex模式輸出。 輸出Latex後,可以轉成Latex 符號,貼到Markdown中。 \[displaystyle 2 k_{2} x + 3 k_{3} x^{2} + 4 k_{4} x^{3} + 5 k_{5} x^{4}\]<mjx-container ctxtmenu_counter=“0” jax=“CHTML” style= …
-
這幾個月公司每天都要上線填體溫與TOCC,但實際上每天關在家中哪裡都沒去,每天的TOCC都一樣。體溫基本上也都在正常範圍。為了不要每天填寫TOCC,因此我寫了一個script來Automate整個填寫過程。真的可以說,懶惰是進步的動力。 ## 主要工具:Selenium。Selenium 主要透過模擬瀏覽器,來完成一些網頁操作的任務。因此很適合操作性的網頁自動化。相對比爬蟲是在做抓取資料以提供後續分析,兩者不太一樣! ps. 要透過selenium 來啟動瀏覽器,要注意一下使用的瀏覽器種類,並去該瀏覽器的網站下載driver。 利用Selenium + python 自動化: from se …