国产91精品在线播放,9久9久热精品视频在线观看,啪啪毛片,九九热在线免费视频,91av毛片,国产91小视频,国产福利区一区二在线观看

設為首頁(yè) - 加入收藏  
您的當前位置:首頁(yè) >綜合 >數據“欺詐”:統計“失誤”如何影響了科研誠信? — 新京報 正文

數據“欺詐”:統計“失誤”如何影響了科研誠信? — 新京報

來(lái)源:四海皆兄弟網(wǎng)編輯:綜合時(shí)間:2025-12-01 05:49:29

《如何確保你的欺詐科研數據真實(shí)可靠:從一個(gè)明星學(xué)者的數據欺詐事件學(xué)到的教訓》一書(shū),可以說(shuō)是數據失誤荷蘭統計學(xué)家克拉斯·西茨馬教授親身經(jīng)歷的荷蘭蒂爾堡大學(xué)社會(huì )與行為科學(xué)學(xué)院的院長(cháng)、社會(huì )心理學(xué)家迪德里克?斯塔佩爾數據造假事件的統計審查總結。這位發(fā)表過(guò)100 多篇頂級期刊論文的何影明星學(xué)者,在 15 年間系統性偽造了 entire 數據集,響科信新包括那篇發(fā)表在《科學(xué)》(Science)上、研誠聲稱(chēng) “骯臟環(huán)境會(huì )加劇歧視行為”的京報重磅研究,實(shí)則全是欺詐憑空編造的謊言。


《如何確保你的科研數據真實(shí)可靠:從一個(gè)明星學(xué)者的數據欺詐事件學(xué)到的教訓》

作者: [荷]克拉斯·西茨馬(Klaas Sijtsma)

譯者:齊心

版本:新星出版社

2025年8月14日


在統計學(xué)家眼中,

“學(xué)術(shù)造假”意味著(zhù)什么?


學(xué)術(shù)造假所引發(fā)的誠信危機,會(huì )對整個(gè)社會(huì )的何影信任度造成極大的沖擊。作為統計學(xué)家,響科信新克拉斯·西茨馬教授在參與調查并得出結論時(shí),研誠提出了學(xué)術(shù)造假的京報不同性質(zhì)及其分類(lèi)——其一,是欺詐沒(méi)有經(jīng)過(guò)實(shí)驗收集數據,而是按照自己假設的理論去“造數據”,這一類(lèi)屬于道德和誠信問(wèn)題,要全盤(pán)否定。另一類(lèi),則是很多學(xué)科的研究人員并沒(méi)有學(xué)過(guò)統計學(xué),在收集到原始的實(shí)驗數據后,不知道自己所采用的統計和分析方式是否能最具有代表性,換句話(huà)說(shuō),每個(gè)發(fā)言的個(gè)體都認為自己無(wú)法被平均、被代表、被概括,而我們的研究則需要在不同的個(gè)體上得出共性,那么這個(gè)統計的數據樣本是否能最大程度的代表這個(gè)人群,這個(gè)數據均值是否能得到更多樣本中個(gè)體的認同,就有一個(gè)方法技巧和局限性的問(wèn)題了。


例如,網(wǎng)上發(fā)布的統計局的數據,為什么和我們的感受不一致?以至于評論區留言最多的是——“這又是36計中的哪一計”,看來(lái),統計口徑和方法,不僅僅是數學(xué)問(wèn)題,也是政治問(wèn)題和社會(huì )問(wèn)題。我們所熟知的人均收入的數據發(fā)布,每次都能收獲無(wú)數的口水和爛番茄、臭雞蛋,但在將收入中位數這個(gè)概念引入之后,似乎比平均值的罵聲就小了很多,然而,收入平均值和中位數,哪一個(gè)更科學(xué)、更接近真實(shí)?統計學(xué)家相信算法公式,而普通人只知道自己的直覺(jué)和感受,在書(shū)中,作者在這里普及了“P值”這個(gè)概念,也就是P值差異超過(guò)0.05、甚至只有0.01或者0.005時(shí),就會(huì )引發(fā)信任危機。這包括選擇樣本時(shí),需要注意的方差,也包括處理個(gè)別極端數值,比如網(wǎng)上常舉的“我和馬云一平均,都是年入千萬(wàn)”例子。


樣本的選擇只能是大多數人的生存狀態(tài),合理選擇是應該去掉極端數值。同時(shí),在樣本數據按照統計方法無(wú)法得出“顯著(zhù)”的結論時(shí),也就是P值大于0.05時(shí),意味著(zhù)你所選擇的樣本數據結果無(wú)法有力支持你的論文觀(guān)點(diǎn),這時(shí)候,如果你選擇修改數據源、更換有利于自己的數據樣本,那么,“造假”的帽子就結結實(shí)實(shí)地戴上了。完全吻合的數據結果,一般只有在排除了各種干擾的實(shí)驗室里才能產(chǎn)生,自然環(huán)境中總有偏差,不完美的數據結果和結論,往往才更符合實(shí)際。


韓國電影《舉報者》劇照。


數據一直是簡(jiǎn)單的,

復雜的從來(lái)都是人


荷蘭研究理事會(huì )2022 年的全國調查顯示,62% 的研究者承認曾“選擇性報告符合假設的結果”(通俗點(diǎn)說(shuō),就是報喜不報憂(yōu)),48% 的人會(huì ) “在看到數據后調整研究假設”。這些被視為“靈活處理”的操作,實(shí)則已觸碰科研誠信的紅線(xiàn)。所以,在C刊論文數量的科研考核模式里,“非升即走”的競爭壓力往往會(huì )逼得科研人員走入“隱形陷阱”。


2016年,威徹茨(Wicherts)等人在《前沿心理學(xué)》發(fā)表的研究指出,34% 的心理學(xué)論文存在“p 值操縱”—— 通過(guò)反復調整分析方法,讓原本不顯著(zhù)的結果變得顯著(zhù)。這也就是公眾對今天的專(zhuān)家(磚家)和教授(叫獸)缺乏信心,認為其喪失道德底線(xiàn)的誘因。本來(lái),個(gè)體的體感差異就會(huì )對樣本數據的結果提出挑戰,而經(jīng)過(guò)操縱的樣本數據所得出的結論,就更難令人信服。


當然,也有一部分“失誤”是“新手”無(wú)意為之??死埂の鞔鸟R教授在審查數百篇論文后發(fā)現,80% 的研究錯誤源于對統計工具的誤讀和錯誤使用,而非惡意造假,但問(wèn)題是,在公眾看來(lái),這同樣也是科研誠信的喪失,因為公眾無(wú)法得知科研人員是否有主觀(guān)造假的意愿,但習慣于將事情往最壞的方面考慮,這也是流行的“底線(xiàn)思維”影響的結果。


阿姆斯特丹大學(xué)心理學(xué)系曾有一項研究試圖證明“性別與數學(xué)能力存在關(guān)聯(lián)”,研究者在分析120 份樣本時(shí),剔除了 12 個(gè)“異常值”—— 這些數據顯示女生數學(xué)成績(jì)優(yōu)于男生。調整后的數據果然呈現“男性成績(jì)顯著(zhù)更高”的結果,并發(fā)表在某知名期刊上。但事后第三方用完整數據重新分析,卻發(fā)現所謂“異常值”恰恰反映了樣本的真實(shí)分布,剔除它們純屬研究者對“極端值處理原則”的誤解。這種因統計無(wú)知導致的結論偏差,在書(shū)中被稱(chēng)為“善意的謊言”,卻可能比惡意造假造成更廣泛的誤導。更常見(jiàn)的錯誤出現在數據處理環(huán)節:范?京克爾2010 年對人格心理學(xué)論文的調查顯示,53% 的研究者使用 “列表刪除法” 處理缺失數據(直接刪掉含缺失值的樣本),卻未檢驗這種方法是否會(huì )扭曲數據分布,從而導致結論出現系統性偏差。、


韓國電影《舉報者》劇照。


最后,克拉斯·西茨馬教授在書(shū)中給我們提出了一套“數據誠信生存指南”。首先,完善預注冊制度。研究者需在收集數據前,將研究假設、方法和分析計劃上傳至開(kāi)放科學(xué)框架(OSF)等公共數據庫,同時(shí),作者在數據收集前需要通過(guò)同行評審,無(wú)論結果是否顯著(zhù)都予以發(fā)表,增強了研究的可信度。其次,開(kāi)放數據。數據不是私產(chǎn),而是科學(xué)共同體的公共資源?!缎睦砜茖W(xué)》2014 年開(kāi)始強制要求作者公開(kāi)原始數據,結果發(fā)現 38% 的 “突破性研究” 因無(wú)法提供完整數據被撤回。2016 年,威徹茨團隊調查發(fā)現,要求公開(kāi)數據后,論文中統計錯誤的修正率從12% 升至 47%。最后,實(shí)行“統計咨詢(xún)強制制”—— 所有科研項目申請必須包含統計專(zhuān)家的審核意見(jiàn)。斯塔佩爾事件之后的蒂爾堡大學(xué),在實(shí)施3 年“統計咨詢(xún)強制制”后,論文因統計“失誤”被撤回的比例下降了54%。


數據一直都是不變的、最簡(jiǎn)單的,而復雜多變的從來(lái)都是人。在這本“數據生存手冊”中,克拉斯·西茨馬教授揭開(kāi)了學(xué)術(shù)論文背后的數據江湖。畢竟,科學(xué)的偉大不在于永不犯錯,而在于敢于直面錯誤?;蛟S你曾為了“顯著(zhù)結果” 反復調整分析方法,或許你因“樣本不夠”而猶豫是否要“優(yōu)化數據”,或許你從未想過(guò)自己信賴(lài)的統計軟件會(huì )給出誤導性結果,但正如書(shū)中所說(shuō):“科研誠信不是道德枷鎖,而是讓數據說(shuō)話(huà)的底氣?!彼顾鍫栐诜ㄍド系膽曰诹钊诉駠u:“我創(chuàng )造的不是知識,而是學(xué)術(shù)界想要的幻想?!边@句話(huà)戳中了科研生態(tài)的痛點(diǎn)——當“發(fā)表數量”壓倒“研究質(zhì)量”,當“完美結果”比“真實(shí)過(guò)程”更受追捧,科學(xué)的本質(zhì)正在被異化。


作者/李杰

編輯/劉亞光 申璐

校對/楊許麗

熱門(mén)文章

    0.5161s , 16605.2578125 kb

    Copyright © 2025 Powered by 數據“欺詐”:統計“失誤”如何影響了科研誠信? — 新京報,四海皆兄弟網(wǎng)  

    sitemap

    Top