2021年09月29日

如何閱讀研究論文？

有幾個領域需要關注。這是我的頂級。

學習類型

雖然存在證據金字塔，但研究問題必須適合研究。有時，隨機對照試驗是不可能的。以確定吸煙風險為例。我們不能隨機分配幾百人每天抽一包煙，再分配幾百人給對照組，然后看看20年內哪個組的死亡率更高。此外，研究時間越長，外部偏見和影響因素（如飲食和運動習慣）影響結果的可能性就越大。但是，當我們查看來自多項研究的所有數據時，情況就很清楚了。

雖然仍然沒有對照試驗，但我們有許多涉及大量受試者的研究一致表明，吸煙越多會增加患肺癌的風險。如果你戒煙，從未過濾切換到過濾，或者從每天吸煙兩包減少到一包，患癌癥的風險就會直線下降。不管你怎么看這個問題，吸煙都會增加患癌癥的風險。因此，雖然一些研究問題永遠不會通過臨床試驗的審查委員會，但有很多方法可以測試假設。

櫻桃采摘數據

研究的主要目標是將結果轉化為現實世界。為此，研究中包含的人員需要代表您要應用結果的人群。如果你想確定力量訓練對孩子有多有效，看看評估中年人的研究幾乎沒有價值。這突出了了解誰被納入研究的重要性。這些問題在營養研究中很常見。

例如，幾個大的潛在隊列得出的結論是，吃紅肉會導致死亡風險增加。與吸煙研究不同，結果并不一致。此外，與素食者相比，研究中包括的肉食者還具有以下特征：

運動頻率和持續時間減少
體重指數增加
吸煙頻率增加
糖尿病患病率增加
增加總熱量攝入
增加酒精攝入量

這就引出了幾個問題。是否有可能是BMI升高，缺乏運動，過多的卡路里攝入或兩者的組合導致死亡率增加而不是紅肉？紅肉很可能導致了這些條件的發展;但是，關聯不是因果關系。

我不會進入營養辯論在這篇文章中。我可以把它留到另一天。相反，我想指出了解誰被研究以及做了什么的重要性。如果一項研究說物理治療并不比家庭鍛煉計劃更有效，他們如何定義物理治療？許多使用物理治療作為包羅萬象的術語的研究都是一般性和低強度的。研究人員設計的程序適合平均水平，而不是來診所的個人。此外，強度通常太低。這給讀者帶來了困惑。我們在看待時必須謹慎觀察性研究，意思是簡單地觀察一段時間內的結果，而不是專門干預4。

小數定律

我們還需要確保研究有足夠的參與者。這被稱為研究的力量。一項把握度不足的研究具有更大的可變性，并且難以得出結論。

請考慮中概述的以下問題思考，快與慢作者：Daniel Kahneman：

最近一項關于美國 3，141 個縣腎癌患病率的研究發現，發病率最低的縣大多是農村，人口稀少，位于中西部、南部和西部的傳統共和黨州。

花點時間考慮一下原因。現在讓我們看看腎癌發病率最高的縣：

他們大多是農村，人口稀少，位于中西部、南部和西部的傳統共和黨州。

這不是錯字。描述完全相同。為什么？答案就在小數定律中。密鑰是“稀疏填充”。低數字導致高可變性。居民人數較少的縣的比率變化最大。

致盲是關鍵

盲法是指參與者、研究人員或兩者都不知道實際干預和對照之間的差異。例如，如果您正在測試藥物的效果，患者是否知道他們正在接受實際的藥丸或糖丸（安慰劑）。安慰劑是醫療保健環境中的一個程序或事件，一個人認為這是一種預期的治療。由此產生的安慰劑效應是當人經歷預期效果時，即使他們接受了確實具有直接作用機制的治療（如抗炎藥）。這意味著如果患者認為他們接受了止痛藥，糖丸會導致疼痛緩解。

研究一致表明安慰劑效應是非常真實，非常強大.通過對研究參與者進行適當的盲法，我們可以確定是否發生了安慰劑效應。如果沒有盲法，我們不知道改善是由于干預的預期作用（例如減少藥物引起的炎癥）還是由于思維的力量，或未知的第三方影響因素（例如睡個好覺）。

參與者并不是唯一需要盲法的人。研究已經證明，當實驗者或提供者認為干預是假的（如糖丸）而不是真正的交易時，他們的行為會有所不同。肢體語言、努力、溝通和面部表情的微妙變化可以提示患者他們沒有接受實驗性治療。這惡化了潛在的改善。

另一個問題是研究人員和參與者都可能表現出表現偏差。這是什么時候如果我們知道我們的表現正在被衡量，我們就會更加努力。研究人員在提供實際治療時可能會更加關注，而不是假的。如果參與者知道他們接受了實驗性治療，他們可能會在性能測試中更加努力。這些細節很少出現在期刊文章或大眾媒體中。

控制變量

另一個問題是控制變量。營養研究參考中對此進行了簡要介紹。雖然一項研究可能會測試鍛煉方案的有效性，但是否跟蹤了參與者的飲食和睡眠模式？飲食和睡眠對運動都有巨大的影響。一些研究確實控制了他們，而另一些則沒有。實驗者呢？

提供治療的臨床醫生的技能如何？除了技術交付的差異之外，患者對關節破裂的看法是什么？如果他們討厭指關節破裂的聲音，或者不喜歡與某人近距離接觸，他們可能會緊張或只是對操縱反應不佳。病人的身心狀況如何？這可能會影響任何類型的實驗。如果他們進入實驗并睡了一個難覺的夜晚，與重要的人吵架，最近在工作中被解雇，或者他們是金鶯隊的球迷，而 MLB 賽季剛剛開始（一個60場比賽的賽季對他們來說可能是一種解脫），他們很可能會處于可能影響結果的糟糕情緒中。我們無法控制一切，但我們應該知道研究的潛在問題。

得出結論

最后，我們有確定“那又怎樣”的藝術。不幸的是，閱讀標題并繼續前進很容易。標題通常具有誤導性或完全歪曲研究結果的實際內容。效果的大小很重要。讓我們回到康復。如果你因為膝蓋疼痛是 6 分（滿分 10 分）而遛狗有困難，那么 5.5 分（滿分 10 分）會有所作為嗎？一項研究可能表明，一種新的治療方法可以提供重要疼痛改善，但大多數患者會對“顯著”一詞翻白眼。研究中的“顯著”一詞通常意味著具有統計學意義。這是指一種統計計算，用于確定由于偶然性而觀察到的效應發生的概率。我不會詳細介紹。有興趣的人，可以閱讀我的詳細研究文章這里.

你更關心的是一些與臨床意義有關的東西。對于疼痛，這通常由 1.5/10 的變化表示。這意味著您需要經歷至少 1.5 的變化才能在您的生活中產生明顯的變化。如果您只是閱讀標題或寫得不好的文章，您將錯過效果大小。這可能會導致您的體重比應有的更重。另一個問題是從相關性中得出結論。

相關性不等于因果關系

相關性只是兩個變量之間的關聯。這種關系可以是積極的，也可以是消極的。例如，學習與更好的考試成績呈正相關。我學習得越多，我的分數就越高。雖然這種相關性是有意義的，許多相關性可以在不相關的情況下完成，但關聯仍然存在。例如，從 1999 年到 2009 年，斯克里普斯國家拼寫蜜蜂獲勝單詞中的字母與被毒蜘蛛殺死的人數相關。我認為可以肯定地說，一個不是另一個原因。您可以找到許多其他有趣且明顯無關的內容例子.查看相關性中的兩個數據集（A 和 B），關系可能是 A 導致 B、B 導致 A 或未知 C 導致 A 和 B。

許多人常說“相關性不等于因果關系”。正如我所表明的，這是真的。不幸的是，這通常被視為類似于“沒有冒犯但......”承認問題但無論如何都要通過的方法。類似于某人在假設免責聲明現在可以的情況下繼續說一些真正令人反感的話，相關性仍然被視為因果關系，并導致對研究的理解有缺陷。

衡量風險

要討論的最后一個問題是相對風險與絕對風險。通常，當標題說“風險的4倍”時，標題會吸引我們的注意力。然而，在不知道初始風險的情況下，這幾乎沒有意義。如果治療副作用的原始風險為1/10，000，則特定患者群體增加4倍幾乎不會引起恐慌。絕對風險是我們最關心的數字。現在，如果絕對風險是5%，并且增加了4倍，那么肯定有理由擔心。我們需要這兩個價值觀。

翻譯證據

歸根結底，目標是將研究轉化為我們的日常生活。不幸的是，許多人沒有接受過有效理解研究所需的培訓。如果我們僅僅依靠頭條新聞和Facebook評論，我們很可能會誤入歧途。這很有挑戰性，但找到源頭，或者至少提出正確的問題，將使您更好地了解研究以及它如何應用于您的生活。最后，以下是閱讀研究報告時要考慮的提示摘要：

我想回答什么問題？
我需要哪些背景信息才能了解這項研究？
誰是研究的參與者？
我正在閱讀什么類型的研究？
該研究的局限性是什么？缺少什么？
在得出結論之前，我需要做哪些后續研究？一項研究永遠不夠

閱讀和消化研究需要實踐。我仍在學習和完善我的閱讀能力，并將研究轉化為日常實踐。我鼓勵你堅持下去并保持好奇心。

“科學知識是一系列不確定/確定性的陳述——有些最不確定，有些幾乎確定，非絕對確定。
— 理查德·費曼