Semantic Scholar vs Google Scholar:研究生該用哪個?

前一陣子有個剛進 lab 的博一學生來找我討論他的研究提案。他的文獻回顧卡得很痛苦。

他告訴我,他把幾個核心概念丟進 Google Scholar,結果跑出三千多篇 paper。他花了一個多禮拜,用關鍵字一頁一頁撈,把摘要看起來有點關聯的都下載下來。結果報 paper 的時候,我發現他漏掉了這個領域近三年最重要的兩篇 foundation papers,反而看了一堆應用型的邊緣文章。

這幾年帶學生找題目,我越來越覺得,初期工具的選擇,會直接決定你摸索期的痛苦指數。大家最直覺、最習慣用的永遠是 Google Scholar。但我通常會建議他們,在你要建立一個陌生領域的 domain knowledge 時,Semantic Scholar 可能是更好的起手式。

這兩者到底該怎麼選?怎麼搭配?

Google Scholar 的致命傷:關鍵字驅動的「資訊海嘯」

Google Scholar 就像是一張孔徑極小的巨大漁網。

它的優勢很明顯:覆蓋率無可挑剔。幾乎只要是有掛在網路上的學術 PDF、甚至是一些尚未出版的 working papers,它都能撈出來。對於已經很清楚自己要找什麼的人來說,這是一個很安心的資料庫。

但這也是它對新手最不友善的地方。

當你輸入一個稍微 broad 一點的關鍵字,它會按照 relevance 和總引用數給你結果。但很多時候,引用數高不代表這篇 paper 對「你現在的問題」最重要。

有些 paper 引用數破千,只是因為它提出了一個常被提及的名詞定義,後來的人在 introduction 都會順手 cite 一下。你很容易迷失在幾百頁的搜尋結果裡,分不清哪篇是方法論的突破,哪篇只是沾到邊的過客。

Semantic Scholar 的破局點:看懂「誰真的有影響力」

Google Scholar 跟 Semantic Scholar 雙工具速查 infographic

這時候,我通常會讓學生停下在 Google Scholar 的漫無目的搜尋。我請他把那兩三篇他覺得最有感覺的 paper,丟進 Semantic Scholar 裡。

Semantic Scholar 是由 Allen Institute for AI 開發的。它最大的差別在於,它試圖去理解文獻與文獻之間的「實質關係」。

它不只是傻傻地算這篇 paper 被引用了幾次,它會用自然語言處理去分析那些引用的 context。

我最常叫學生看的一個功能是「Highly Influential Citations」。一篇經典 paper 可能有 800 個引用,但 Semantic Scholar 會幫你過濾出,真正把這篇 paper 當作核心基礎、有在內文深入討論甚至延伸其方法的,可能只有不到 30 篇。

——這對一個正在海裡掙扎的研究生來說,就是把一個禮拜的盲目 reading,縮短成一個下午的精準打擊。

什麼時候你「必須」留在 Google Scholar?

雖然我在初期更推崇 Semantic Scholar 的網絡篩選能力,但有些場景下,Google Scholar 還是目前無法被完全取代的工具。

1.

Semantic Scholar vs Google Scholar:研究生該用哪個? Read More »

再也不漏掉重要論文?用 academic-journal-rss + Claude Code 打造研究生的自動文獻追蹤系統

很多研究生其實不是不知道文獻重要,而是追文獻這件事,長期都靠手動。

你可能訂了幾本期刊的 Email,存了幾個 Google Scholar 搜尋結果,書籤裡也放了幾個常看的 journal 網站。問題不是你沒有來源,而是這些來源太分散。

最後常見的情況是:你明明一直有在「接收資訊」,卻沒有穩定進入自己的研究流程。

這篇文章想介紹一個我很喜歡的做法:用開源工具 academic-journal-rss,把學術期刊與研究部落格的 RSS 更新每天自動抓下來,再用 Claude Code 根據你的研究興趣做初步排序,最後輸出成一份 markdown digest,直接放進 Obsidian。

它的價值不只是「自動收新論文」,而是把文獻追蹤從零碎動作,變成一套真正能持續運作的系統。

什麼是 academic-journal-rss?

academic-journal-rss 是一個開源工具,定位很清楚:每天抓取學術期刊或研究部落格的 RSS feed,挑出新內容,根據你的研究興趣做排序,最後輸出成一份可以直接打開閱讀的 markdown 摘要。

這個工具特別適合研究者,因為它不是單純把所有更新都丟給你,而是把「新文獻追蹤」和「研究興趣篩選」接在一起。

根據專案 README,它的核心流程是:

  1. 你先設定要追蹤的 RSS feeds
  2. 再寫一小段研究興趣描述
  3. 工具每天抓取這些來源的新內容
  4. 用 Claude Code 根據你的研究興趣排序
  5. 產出一份每日 digest markdown 檔案

也就是說,它不是另一個資訊入口而已,而是一個幫你先做第一輪整理的研究助手。

這個工具實際在做什麼?

根據 GitHub 上的說明,academic-journal-rss 的 daily 流程大致是:

sync → 抓取所有 feeds → filter new items → rank against interests → write markdown digest → notify

這裡最有意思的,不是「抓 RSS」本身,而是它把「研究興趣」變成篩選條件。

也就是說,如果你研究的是 AI feedback、higher education、language learning,那你不是每天收到一大堆原始更新而已,而是收到一份更接近這種形式的結果:今天有哪些新文獻、哪些最接近你的研究方向、哪些值得優先看、哪些可以先略過。

這比單純追蹤期刊更新,實用很多。

為什麼研究者需要這種工具?

我帶學生時,最常看到的問題不是沒資源,而是資訊太散。

這種散,通常表現在幾個地方:

  • 你追蹤來源分散:有些更新來自 Email,有些來自期刊網站,有些來自 Google Scholar,有些只是你想到時才去看。
  • 你沒有固定節奏:今天看、明天忘、下週補,最後很難建立穩定的文獻追蹤習慣。
  • 你每天都要重新判斷:哪篇是新的?哪篇和我有關?哪篇值得先讀?

而 academic-journal-rss 的價值就在於:它把這些零碎判斷前移,先幫你做第一輪整理。你每天打開的,不再是一堆散亂更新,而是一份已經整理過的研究入口。

它怎麼安裝?

根據 repo 說明,基本安裝方式是:

git clone https://github.com/chinhsi/academic-journal-rss.git

再也不漏掉重要論文?用 academic-journal-rss + Claude Code 打造研究生的自動文獻追蹤系統 Read More »

發了三篇頂刊後,我想談談 Profile Analysis 這條研究思路

開場:為什麼我後來幾乎每個研究都會走到 Profile Analysis

我是做教育研究的。這幾年回頭看自己做過的題目,從自我調節學習(self-regulated learning, SRL)、motivation,到 learner differences,雖然表面上研究主題不一樣,但有一件事越來越明確:很多研究計畫走到最後,我都會回到 Profile Analysis 這條思路。

這裡說的自我調節學習,指的是學生能不能自己設定目標、監控進度、調整策略,讓學習不只是被動完成,而是主動管理。

不是因為它比較新,也不是因為它看起來比較厲害。更根本的原因是:教育本質上是人的問題。

教育研究當然可以用很多變項來解釋。你可以看動機高低、策略使用、學習成績、背景變項,也可以做相關、迴歸、ANOVA、SEM。這些方法都重要,也都常用。但如果你真的在研究「人」,你很快就會發現:單一變項本身固然重要,可是真正更有意思的,往往是不同變項之間怎麼組合在同一個人身上。

有些學生不是單純動機高或低,而是動機高但策略弱;有些人策略很多,但監控能力差;有些人表面上總分差不多,可是背後其實是完全不同的 learner type。這些差異,如果只看平均效果,常常會被壓平。

這也是為什麼我後來越來越常用 Profile Analysis。它不是拿來炫技的統計方法,而是一條比較貼近教育問題本質的研究思路。這篇文章想談的,就是:為什麼有些研究做到最後,不能只停在平均數或單一變項關係,而必須進一步去看 profile。

Variable-centered 和 person-centered,問的根本不是同一件事

大部分研究生比較熟悉的,是 variable-centered 的分析方式。

Variable-centered 視角一條回歸線 vs Person-centered 視角三個 learner cluster
同一批資料,兩種觀點:Variable-centered 看平均趨勢 vs Person-centered 看 learner types

你問的是:

  • X 和 Y 有沒有關係?
  • 哪個變項可以預測哪個結果?
  • 組別之間平均差多少?

這是迴歸、ANOVA、SEM 這一整條分析邏輯最擅長處理的問題。它很好用,也完全合理。很多研究問題,本來就應該這樣問。

但 person-centered 的出發點不一樣。

它問的是:

  • 這群人裡面,是不是本來就有不同類型?
  • 這些類型之間,各自有什麼特徵組合?
  • 不同類型的人,後續表現、結果、風險或需求是否不同?

所以這不是「同一個問題的進階版」,而是另一種問問題的方式

舉例來說,如果你研究學生的自我調節學習(SRL):

  • variable-centered 可能會問:

「SRL 總分能不能預測成績?」

  • person-centered 可能會問:

「學生是不是可以分成不同 SRL profile?而且不同 profile 的成績、動機、表現是否不同?」

這兩種做法都可以成立,但它們看到的東西不一樣。

為什麼教育研究特別需要這條思路

在很多教育研究裡,人不是平均數

同樣的平均分 70,學生 A/B/C 有完全不同的 profile 組合
同樣平均分,不同 profile 組合(自主 / 策略 / 動機 / 投入四個維度)

有些學生不是單純高或低,而是「某些面向很強、某些面向很弱」。你如果把這些人全部壓成一個總分,再拿去做相關或迴歸,分析本身可能沒有錯,但你可能已經把最有價值的教育訊息壓掉了。

例如,你研究大學生的時間管理策略,量表有四個分量表:計畫制定、優先排序、執行監控、彈性調整。你把四個分量表加總,然後發現總分和 GPA 相關 .28。

這個分析不是錯,而是不夠。

因為同樣一個總分下面,可能有完全不同的學生:

  • 有些人計畫制定很強,但彈性調整很差
  • 有些人每個面向都中等,但非常穩定
  • 有些人執行監控很強,可是前期規劃很弱

這些人最後在學習表現上可能走向不同結果,但如果你只看一個總分,你就看不見這些差異。

這也是我認為 Profile Analysis 在教育研究裡特別有價值的原因。教育現場真正關心的,往往不是「平均來說這群學生怎麼樣」,而是:這群學生裡面,有哪些不同型態,而不同型態的人需要什麼樣的理解與介入。

Profile Analysis 到底在做什麼

先講最白話的一句:

Profile Analysis 想做的,不是看單一變項的效果,而是辨識人群裡不同的組合型態。

這裡有幾個概念要先分清楚:

1.

發了三篇頂刊後,我想談談 Profile Analysis 這條研究思路 Read More »

SEM 實作路線圖/入口橋樑文

SEM 實作路線圖/入口橋樑文

為什麼很多人一學 SEM 就迷路?

很多研究生學 SEM(結構方程模型)最大的坑,就是一上來就打開 Amos 或 Mplus,然後被滿畫面的圓圈、方塊和滿天飛的數字淹沒。

他們會急著問:「CFI 要多少才算好?」「RMSEA 超過 0.08 怎麼辦?」「為什麼我的模型跑不出來?」

但這些問題背後,往往是更根本的困惑:我到底現在卡在哪裡?

不要試圖一次「學完」SEM。SEM 是一個龐大的工具箱,你不需要每個工具都會用。在卡關焦慮之前,你應該先確定自己現在處於學習地圖的哪一個位置。

這篇文章是一份給新手的 SEM 實作路線圖,幫你判斷自己目前卡在哪裡、下一步應該先學什麼。

第一關:釐清心法——SEM ≠ 因果

最常見的誤區:把路徑圖當成因果證明

初學者常有一個錯覺:只要我在 Amos 或 Mplus 裡畫了一個單向箭頭,跑出來顯著,我就「證明」了因果關係。

錯了。

箭頭是你畫的,理論是你定的,軟體只負責告訴你「這組資料跟你的理論架構配不配」。

如果你的研究設計本身不是實驗操弄、不是縱貫性資料(追蹤同一群人在不同時間點),SEM 無法無中生有地為你創造出因果。它只能在「你的理論是對的」這個前提下,檢驗資料是否支持這套架構。

SEM 因果對照圖
SEM ≠ 因果:路徑圖不代表因果證明

心法建議

在開啟任何 SEM 軟體之前,先把你的理論邏輯理清楚:

  • 為什麼 A 會影響 B?
  • 中間的機制是什麼?
  • 有沒有替代解釋?

軟體只是檢驗工具,不能幫你想清楚研究問題。

第二關:測量模型——先看 CFA,再看路徑

常見錯誤:急著看假設顯不顯著

很多研究生把資料丟進 SEM 後,第一個動作是看「假設 H1 有沒有顯著」。這是致命的順序錯誤。

在檢驗任何結構路徑之前,你必須先確認你的測量模型是穩固的。

測量模型的關鍵指標

CFA(驗證性因素分析)是 SEM 的第一步。你必須確認:

  • CFI(比較適配指數):通常建議 0.90,愈高愈好
  • RMSEA(近似誤差均方根):通常建議 < 0.08,< 0.05 更佳
  • SRMR:通常建議 < 0.08

如果你的 CFI 連 0.9 都不到,RMSEA 飆高,這代表你的「測量工具」本身就有問題——可能是題項設計不良、信度不足,或因素結構不如預期。

這時候後面的路徑係數再怎麼顯著,都是建立在沙地上的樓閣。測量都測不準,後面的推論毫無意義。

進階閱讀

如果你對 CFA 還不熟悉,建議先看完這篇入門:

第三關:結構模型與複雜路徑

測量過關後,才進入結構模型

當你的 CFA 配適度及格、組合信度與變異數萃取量都達標,才可以進到正式的「結構模型」階段,檢驗你的研究假設。

這裡你會遇到各種複雜的路徑問題:

  • 單純的相關或迴歸路徑?
  • 中介效果(X 透過 M 影響 Y)?
  • 調節效果(W 改變 X→Y 的強弱)?
  • 還是更複雜的「調節中介(Moderated Mediation)」?

SEM 一次做,還是 PROCESS 分開做?

這是許多研究生的選擇難題:

用 SEM(Amos/Mplus/R lavaan):

  • 優點:可以一次估計整個模型、處理潛在變數、處理多個中介或調節的組合
  • 缺點:學習曲線較陡、軟體操作較複雜

用 PROCESS macro(在 SPSS 中):

  • 優點:入門門檻低、 Hayes 的文件與範本非常完整
  • 缺點:只能處理觀察變數(總分)、複雜模型需要分段跑

判斷原則

  • 如果你的變數是「總分」(而非潛在因素),且模型相對簡單 → PROCESS 可能更快速
  • 如果你的模型有潛在變數、多個中介鏈、或需要同時估計測量與結構 → SEM 更全面

關於 PROCESS 的使用時機,可以參考這篇:

常見卡點分類:你現在卡在哪?

根據過去指導學生的經驗,學習 SEM 的人通常會卡在以下四種情境:

卡點一:把工具當答案

症狀:「我學會了 Amos 怎麼按按鈕,但我不知道我的研究問題適不適合用 SEM。」

解方:回到研究問題。SEM 適合檢驗「理論架構」,但不適合探索「我不知道變數之間有什麼關係」。探索性分析請用 EFA、相關分析或質化研究。

卡點二:只看 fit 不看理論

症狀:「我的 CFI 0.95,RMSEA 0.06,所以可以發表了?」

解方:Fit indices 只是「必要條件」而非「充分條件」。好的配適度只代表「你的模型架構跟資料不矛盾」,不代表你的理論是對的。還是要回到文獻、邏輯、與實務意義來解釋。

卡點三:把路徑圖誤認為因果證明

症狀:「我的模型顯著,所以我證明了 A 導致 B。」

解方:重申一次:SEM 是檢驗「你的理論架構是否與資料一致」,而不是發明因果。因果推論需要研究設計的配合(實驗、縱貫、工具變數等)。即使是縱貫 SEM,也只能提供較強的證據,而非因果的充分條件。

卡點四:太早追進階模型

症狀:「我想直接跑調節中介的完整 SEM,但我連基本的 CFA 都還不確定自己做對沒有。」

解方:複雜模型是建立在簡單模型的基礎上。如果你的基本中介都跑不穩,貿然進入調節中介只會讓錯誤更難排查。先確認你能獨立完成簡單中介或單純路徑,再考慮進階模型。

延伸閱讀

Shadish, W.…

SEM 實作路線圖/入口橋樑文 Read More »

Literature Review 怎麼寫才不爛?避開摘要流水帳的實作流程

寫 thesis proposal 或論文第二章時,最常被教授打槍的問題是什麼?

不是文獻讀得不夠多,是讀完之後寫成了高級摘要集。A 學者說了什麼、B 學者發現了什麼、C 學者的結論是⋯⋯寫到最後,讀者只知道你讀了 30 篇 paper,但看不出這 30 篇跟你的研究有什麼關係。

這篇的目標很簡單:給你一個可執行的 workflow,從「開始搜尋」到「寫出段落」,避免把 literature review 寫成逐篇摘要。

六步流程:從搜尋到段落

文獻回顧六步流程圖
文獻回顧六步流程,從搜尋、快讀、整合對照表,到抽取主題、找出缺口,再用 MEAL 架構寫成段落。

Step 1:搜尋與初步篩選

先承認一件事:你不可能讀完所有相關文獻。重點是建立一個「夠用且可管理」的文獻池。

實際操作

  • 從 2-3 篇該領域的權威 review article 或 meta-analysis 入手,抓出核心概念與關鍵字
  • 用關鍵字在 Scopus / Web of Science / Google Scholar 搜尋,設定時間範圍(建議近 10-15 年為主,標誌性經典除外)
  • 第一輪篩選看 title + abstract,只保留「可能相關」的,不要糾結當下判斷是否準確
  • 目標:建立一個 30-50 篇的「待讀清單」,之後會再縮減

常見錯誤:搜尋階段就過度篩選,或糾結「這篇到底要不要讀」而卡住。先抓進來,step 2 再判斷。

Step 2:快讀與分類標記

這階段不要逐字讀。用「快讀 + 標記」建立文獻的初步定位。

實際操作

  • 每篇控制在 15-20 分鐘:讀 abstract → 掃 introduction 最後一段(研究目的)→ conclusion
  • 在 reference manager(Zotero、EndNote、Mendeley)裡加標籤:按主題(#認知負荷#遊戲化學習)、按方法(#實驗法#質性訪談)、按立場(#支持 X 理論#質疑 X 理論
  • 同時記錄:這篇的研究對象、主要發現、方法限制(用簡短 keyword,不要完整摘要)

重點:這階段的筆記是「給搜尋用的」,不是給寫作用的。目的是讓你之後能快速找到「有哪些文獻講了這個主題」。

Step 3:建立 Synthesis Matrix

這是從「摘要模式」切換到「綜合模式」的關鍵步驟。Synthesis Matrix 是一張橫向比較表,讓你看到「關於某個概念,多篇文獻各自說了什麼」。

作者 (年份) 研究對象 核心發現:X → Y 的關係 方法限制 與本研究的關聯
Chen (2020) 大學生 正向但微弱 (β = .12) 橫斷式設計 需要縱貫驗證
Wang (2021) 高中生 調節效果:動機為 moderator 樣本僅台北 可擴展到南部
Lin (2022) 在職進修 無顯著效果 自我回報量表 可能測量誤差

為什麼不用傳統摘要?傳統摘要是你對著單篇文獻寫「這篇說了什麼」;Matrix 是讓你橫向看「這幾篇對同一個議題有什麼不同說法」。後者才能幫你找 pattern。

工具建議:Excel、Google Sheets、Notion database 都可以。重點是「能橫向比較」,不是用什麼軟體。

Step 4:從 Matrix 抽出 Themes

讀完 Matrix,下一步是問:這些文獻能歸成幾個主題?不是問「有哪些作者」,是問「有哪些論述脈絡」。

抽 theme 的三個判準

  1. 共識區(Consensus):哪些觀點是多方支持的?這構成你文獻回顧的「背景共識」段落。
  2. 爭議區(Controversy):哪些議題有對立觀點或矛盾結果?這是文獻回顧的「對話核心」,也是你展現批判性思考的地方。
  3. 缺口區(Gap):哪些重要問題還沒被充分回答?這直接導向你的研究問題。

實例:不是「A、B、C 都研究了認知負荷」,而是「關於認知負荷的測量,目前存在兩派:客觀生理指標派 vs.…

Literature Review 怎麼寫才不爛?避開摘要流水帳的實作流程 Read More »

Scroll to Top