研究者做文獻筆記,真正該外包給 AI 的不是理解,而是整理

前一陣子帶學生看他的文獻回顧,發現他把大把時間花在非常瑣碎的動作上:把 PDF 裡的一段話 highlight 起來,複製貼到 Word,手動打上標籤,再嘗試用幾句話去統整這篇 paper 的貢獻。我問他這週看了幾篇,他說看懂了五六篇,但光是「做筆記」就耗掉了一整天的時間。

這是我在指導學生時最常看到的一個現象。

這篇文章整理自我的 YouTube 影片,若想直接看操作畫面,也可以直接在這裡播放:

若想開新分頁到 YouTube 看完整頁面,也可以點這裡:
https://www.youtube.com/watch?v=PKvgwp2Ff8M

研究者做文獻筆記,真正該外包給 AI 的不是理解,而是整理 Read More »

APA 7 統計報告格式:最常寫錯的 10 個地方 thumbnail

APA 7 統計報告格式:最常寫錯的 10 個地方

APA 7 統計報告格式:最常寫錯的 10 個地方

我最近改一份 results section,第一個檢定結果就把 t 值、自由度和 p 值拆成三截,下一句再補一句「達顯著差異」。分析本身不一定有錯,但這種寫法一出現,我通常就知道作者還停在「把軟體輸出貼進論文」的階段。

APA 7 的統計報告格式麻煩的地方,不是規則很多,而是明確規則、期刊慣例和成稿一致性常常混在一起。你單看其中一條,可能覺得只是格式;但同一句裡連錯三四條,審稿人通常很快就會先扣信任分。下面這 10 個地方,是我改稿時最常抓出來的問題。

1.

APA 7 統計報告格式:最常寫錯的 10 個地方 Read More »

Semantic Scholar vs Google Scholar:研究生該用哪個?

前一陣子有個剛進 lab 的博一學生來找我討論他的研究提案。他的文獻回顧卡得很痛苦。

他告訴我,他把幾個核心概念丟進 Google Scholar,結果跑出三千多篇 paper。他花了一個多禮拜,用關鍵字一頁一頁撈,把摘要看起來有點關聯的都下載下來。結果報 paper 的時候,我發現他漏掉了這個領域近三年最重要的兩篇 foundation papers,反而看了一堆應用型的邊緣文章。

這幾年帶學生找題目,我越來越覺得,初期工具的選擇,會直接決定你摸索期的痛苦指數。大家最直覺、最習慣用的永遠是 Google Scholar。但我通常會建議他們,在你要建立一個陌生領域的 domain knowledge 時,Semantic Scholar 可能是更好的起手式。

這兩者到底該怎麼選?怎麼搭配?

Google Scholar 的致命傷:關鍵字驅動的「資訊海嘯」

Google Scholar 就像是一張孔徑極小的巨大漁網。

它的優勢很明顯:覆蓋率無可挑剔。幾乎只要是有掛在網路上的學術 PDF、甚至是一些尚未出版的 working papers,它都能撈出來。對於已經很清楚自己要找什麼的人來說,這是一個很安心的資料庫。

但這也是它對新手最不友善的地方。

當你輸入一個稍微 broad 一點的關鍵字,它會按照 relevance 和總引用數給你結果。但很多時候,引用數高不代表這篇 paper 對「你現在的問題」最重要。

有些 paper 引用數破千,只是因為它提出了一個常被提及的名詞定義,後來的人在 introduction 都會順手 cite 一下。你很容易迷失在幾百頁的搜尋結果裡,分不清哪篇是方法論的突破,哪篇只是沾到邊的過客。

Semantic Scholar 的破局點:看懂「誰真的有影響力」

Google Scholar 跟 Semantic Scholar 雙工具速查 infographic

這時候,我通常會讓學生停下在 Google Scholar 的漫無目的搜尋。我請他把那兩三篇他覺得最有感覺的 paper,丟進 Semantic Scholar 裡。

Semantic Scholar 是由 Allen Institute for AI 開發的。它最大的差別在於,它試圖去理解文獻與文獻之間的「實質關係」。

它不只是傻傻地算這篇 paper 被引用了幾次,它會用自然語言處理去分析那些引用的 context。

我最常叫學生看的一個功能是「Highly Influential Citations」。一篇經典 paper 可能有 800 個引用,但 Semantic Scholar 會幫你過濾出,真正把這篇 paper 當作核心基礎、有在內文深入討論甚至延伸其方法的,可能只有不到 30 篇。

——這對一個正在海裡掙扎的研究生來說,就是把一個禮拜的盲目 reading,縮短成一個下午的精準打擊。

什麼時候你「必須」留在 Google Scholar?

雖然我在初期更推崇 Semantic Scholar 的網絡篩選能力,但有些場景下,Google Scholar 還是目前無法被完全取代的工具。

1.

Semantic Scholar vs Google Scholar:研究生該用哪個? Read More »

再也不漏掉重要論文?用 academic-journal-rss + Claude Code 打造研究生的自動文獻追蹤系統

很多研究生其實不是不知道文獻重要,而是追文獻這件事,長期都靠手動。

你可能訂了幾本期刊的 Email,存了幾個 Google Scholar 搜尋結果,書籤裡也放了幾個常看的 journal 網站。問題不是你沒有來源,而是這些來源太分散。

最後常見的情況是:你明明一直有在「接收資訊」,卻沒有穩定進入自己的研究流程。

這篇文章想介紹一個我很喜歡的做法:用開源工具 academic-journal-rss,把學術期刊與研究部落格的 RSS 更新每天自動抓下來,再用 Claude Code 根據你的研究興趣做初步排序,最後輸出成一份 markdown digest,直接放進 Obsidian。

它的價值不只是「自動收新論文」,而是把文獻追蹤從零碎動作,變成一套真正能持續運作的系統。

什麼是 academic-journal-rss?

academic-journal-rss 是一個開源工具,定位很清楚:每天抓取學術期刊或研究部落格的 RSS feed,挑出新內容,根據你的研究興趣做排序,最後輸出成一份可以直接打開閱讀的 markdown 摘要。

這個工具特別適合研究者,因為它不是單純把所有更新都丟給你,而是把「新文獻追蹤」和「研究興趣篩選」接在一起。

根據專案 README,它的核心流程是:

  1. 你先設定要追蹤的 RSS feeds
  2. 再寫一小段研究興趣描述
  3. 工具每天抓取這些來源的新內容
  4. 用 Claude Code 根據你的研究興趣排序
  5. 產出一份每日 digest markdown 檔案

也就是說,它不是另一個資訊入口而已,而是一個幫你先做第一輪整理的研究助手。

這個工具實際在做什麼?

根據 GitHub 上的說明,academic-journal-rss 的 daily 流程大致是:

sync → 抓取所有 feeds → filter new items → rank against interests → write markdown digest → notify

這裡最有意思的,不是「抓 RSS」本身,而是它把「研究興趣」變成篩選條件。

也就是說,如果你研究的是 AI feedback、higher education、language learning,那你不是每天收到一大堆原始更新而已,而是收到一份更接近這種形式的結果:今天有哪些新文獻、哪些最接近你的研究方向、哪些值得優先看、哪些可以先略過。

這比單純追蹤期刊更新,實用很多。

為什麼研究者需要這種工具?

我帶學生時,最常看到的問題不是沒資源,而是資訊太散。

這種散,通常表現在幾個地方:

  • 你追蹤來源分散:有些更新來自 Email,有些來自期刊網站,有些來自 Google Scholar,有些只是你想到時才去看。
  • 你沒有固定節奏:今天看、明天忘、下週補,最後很難建立穩定的文獻追蹤習慣。
  • 你每天都要重新判斷:哪篇是新的?哪篇和我有關?哪篇值得先讀?

而 academic-journal-rss 的價值就在於:它把這些零碎判斷前移,先幫你做第一輪整理。你每天打開的,不再是一堆散亂更新,而是一份已經整理過的研究入口。

它怎麼安裝?

根據 repo 說明,基本安裝方式是:

git clone https://github.com/chinhsi/academic-journal-rss.git

再也不漏掉重要論文?用 academic-journal-rss + Claude Code 打造研究生的自動文獻追蹤系統 Read More »

發了三篇頂刊後,我想談談 Profile Analysis 這條研究思路

開場:為什麼我後來幾乎每個研究都會走到 Profile Analysis

我是做教育研究的。這幾年回頭看自己做過的題目,從自我調節學習(self-regulated learning, SRL)、motivation,到 learner differences,雖然表面上研究主題不一樣,但有一件事越來越明確:很多研究計畫走到最後,我都會回到 Profile Analysis 這條思路。

這裡說的自我調節學習,指的是學生能不能自己設定目標、監控進度、調整策略,讓學習不只是被動完成,而是主動管理。

不是因為它比較新,也不是因為它看起來比較厲害。更根本的原因是:教育本質上是人的問題。

教育研究當然可以用很多變項來解釋。你可以看動機高低、策略使用、學習成績、背景變項,也可以做相關、迴歸、ANOVA、SEM。這些方法都重要,也都常用。但如果你真的在研究「人」,你很快就會發現:單一變項本身固然重要,可是真正更有意思的,往往是不同變項之間怎麼組合在同一個人身上。

有些學生不是單純動機高或低,而是動機高但策略弱;有些人策略很多,但監控能力差;有些人表面上總分差不多,可是背後其實是完全不同的 learner type。這些差異,如果只看平均效果,常常會被壓平。

這也是為什麼我後來越來越常用 Profile Analysis。它不是拿來炫技的統計方法,而是一條比較貼近教育問題本質的研究思路。這篇文章想談的,就是:為什麼有些研究做到最後,不能只停在平均數或單一變項關係,而必須進一步去看 profile。

Variable-centered 和 person-centered,問的根本不是同一件事

大部分研究生比較熟悉的,是 variable-centered 的分析方式。

Variable-centered 視角一條回歸線 vs Person-centered 視角三個 learner cluster
同一批資料,兩種觀點:Variable-centered 看平均趨勢 vs Person-centered 看 learner types

你問的是:

  • X 和 Y 有沒有關係?
  • 哪個變項可以預測哪個結果?
  • 組別之間平均差多少?

這是迴歸、ANOVA、SEM 這一整條分析邏輯最擅長處理的問題。它很好用,也完全合理。很多研究問題,本來就應該這樣問。

但 person-centered 的出發點不一樣。

它問的是:

  • 這群人裡面,是不是本來就有不同類型?
  • 這些類型之間,各自有什麼特徵組合?
  • 不同類型的人,後續表現、結果、風險或需求是否不同?

所以這不是「同一個問題的進階版」,而是另一種問問題的方式

舉例來說,如果你研究學生的自我調節學習(SRL):

  • variable-centered 可能會問:

「SRL 總分能不能預測成績?」

  • person-centered 可能會問:

「學生是不是可以分成不同 SRL profile?而且不同 profile 的成績、動機、表現是否不同?」

這兩種做法都可以成立,但它們看到的東西不一樣。

為什麼教育研究特別需要這條思路

在很多教育研究裡,人不是平均數

同樣的平均分 70,學生 A/B/C 有完全不同的 profile 組合
同樣平均分,不同 profile 組合(自主 / 策略 / 動機 / 投入四個維度)

有些學生不是單純高或低,而是「某些面向很強、某些面向很弱」。你如果把這些人全部壓成一個總分,再拿去做相關或迴歸,分析本身可能沒有錯,但你可能已經把最有價值的教育訊息壓掉了。

例如,你研究大學生的時間管理策略,量表有四個分量表:計畫制定、優先排序、執行監控、彈性調整。你把四個分量表加總,然後發現總分和 GPA 相關 .28。

這個分析不是錯,而是不夠。

因為同樣一個總分下面,可能有完全不同的學生:

  • 有些人計畫制定很強,但彈性調整很差
  • 有些人每個面向都中等,但非常穩定
  • 有些人執行監控很強,可是前期規劃很弱

這些人最後在學習表現上可能走向不同結果,但如果你只看一個總分,你就看不見這些差異。

這也是我認為 Profile Analysis 在教育研究裡特別有價值的原因。教育現場真正關心的,往往不是「平均來說這群學生怎麼樣」,而是:這群學生裡面,有哪些不同型態,而不同型態的人需要什麼樣的理解與介入。

Profile Analysis 到底在做什麼

先講最白話的一句:

Profile Analysis 想做的,不是看單一變項的效果,而是辨識人群裡不同的組合型態。

這裡有幾個概念要先分清楚:

1.

發了三篇頂刊後,我想談談 Profile Analysis 這條研究思路 Read More »

Scroll to Top