📋 建置紀錄 Changelog
laowang-agent 從「散落 OCR」演進為「可查詢、能說故事、能精準回顧」雙視角資料系統的歷程。 專案 2026-06-03 啟動,以下為自啟動起的完整建置紀錄(由近至遠),每條皆為已完成並驗證的項目。 對應 vault 筆記《老王Agent 資料系統建置紀錄》與《老王方法論 CHANGELOG》。非投資建議。
名詞:NLM=NotebookLM(Google 筆記型 RAG,存逐字稿供檢索)・STT=語音轉文字(YT 自動字幕,有同音錯字需校正)・ FinMind=台股法人籌碼開源 API・twstock=台股股價開源套件・OCR=截圖文字辨識(本機 vision-ocr.swift,圖不離機)。
2026-06-06 — 細粒度方法 × 個股故事線 × 全球前後驗證
- 個股分析法 #tag 系統:建
method_tags(16 標籤:型態 4/權值 1/類股 7/通用 4)+ticker_method_tags(218 個股↔方法連結),依類股自動掛載。入口站新增methods.html(方法總覽)+method.html(每標籤詳解頁),個股頁「這檔股票的分析法」#tag 可點開看原話佐證詳解。 - YT 提及完整化(內文非僅標題):全 25 檔個股掃描 2026 全 75 部全文,782 次提及(台積電 472/鴻海 182/廣達 16)。STT 同音校正 鴻海→「紅海」(184 處,排除地理紅海危機);個股頁收疊式呈現老王原話 excerpt(窗格抽取,STT 無標點)。
harvest_yt_transcripts.py取 NLM 全文入sources.fulltext(75 部,繞過終端 2,193 字截斷)。 - 細粒度方法萃取(NLM CLI 主力):用 NLM ask/configure 從 YT 全文+近 5 天訂閱萃取 7 大類型法,
corpus_training/2026-06-06_老王細粒度分析法_類型法.md(595 行)。Gemini 完整寫入 vault:6 篇新方法 note(記憶體族群/晶圓代工/面板族群/被動元件/AIPC 伺服器/載板 ABF),均附 OCR/全文佐證、wikilinks(方法論資料夾達 29 筆)。 - 三檔個股 2026 完整看法故事線:建
stock_timeline(時間線)+stock_verification(前後驗證鏈)表,台積電/鴻海/廣達 NLM 全文萃取「預告→發展→回頭印證/打臉」。誠實標記:鴻海 1 月喊 300 被打臉→認錯停損;廣達 6/3 樂觀→6/4-5 打臉。 - 截圖搬移 SOP(補洞):建
reconcile_processed.sh安全網——已入庫卻卡佇列的截圖補搬_processed/(sha256→檔名比對,冪等),接入self_learn.sh[0]+ watcher 啟動掃描。link_screenshots_tickers.py補連截圖↔個股(101 連結)。 - 全球財經前後驗證故事線:6/6 老王粉專貼文+finviz 熱力圖入 vault(
全球財經覆盤/2026-06-06-美股半導體殺盤.md)+網頁。11 全球實體,3 待驗證觀察點(主線擴散/泡沫論辯/費半 -10%→記憶體連動美光→台股次日壓力)。建verify_global.py:6/8 台股開盤後以 twstock 真實股價自動判定費半→台股傳導,今日週六誠實印「🔄待驗證」不杜撰未來。已接self_learn.sh[1b]。
2026-06-05 — 資料系統雙視角升級
- 全來源結構化:建
sources表(75 YT+3 訓練 MD+43 截圖=121 筆),NLM↔SQLite 78=78 完全映射。 - 全球財經實體:
tickers.market維度納 11 檔(博通/輝達/美光/標普500/費半/那指/估值/房市…),全 OCR 字面證據;entity_sources跨來源連結。 - 故事線驗證:33 條老王預告 × twstock 真實股價 → 數據判定命中。誠實分布:✅命中 7・✅延續 6・❌未中 11・⏳待驗證 9。
- 術語結構化:glossary 16 術語(均線/量能/型態/法人),定義全從 OCR 萃取,附真實出現次數。
- 三大法人籌碼:接 FinMind 抓 24 檔真實外資/投信/自營買賣超,個股頁技術面+籌碼面雙視角。發現旺宏外資先跑(買 27,577 張→轉賣)與股價 −14.5% 同步。
- 技術線圖 CLI:
tw_chart.py自繪台股 K 線(twstock+mplfinance,紅漲黑跌/SMA20/壓力線),非付費內容可公開。 - 訓練回灌:成果整理成訓練文件餵進 NLM(self-learning loop);入口站專案簡介更新;新增本 changelog page。
2026-06-03(深夜)— Phase B 訓練雛形
- NLM 跨 75 部影片 consolidate,產出訓練模型 v1(法人分流、權值股 SOP、目標價算法、國際連動、分盤 SOP)+術語知識庫+台股知識庫。
2026-06-03(晚)— YT 語料庫建成
- 「不只三分鐘」2026 全 75 部灌進 NLM RAG(resumable 3 輪)。建 vision-ocr.swift 本機繁中 OCR + laowang-ingest skill(截圖入庫流程,圖不離機)。
2026-06-03 — 方法庫初建
- 系統化老王方法論 7 大類(均線/量能籌碼/型態/選股/操作紀律/預告制/國際連動),全附原話佐證。多源整合 15 張臉書截圖補影片缺漏。建 11 筆 vault 筆記。