老王 Agent 訓練計畫書
一句話:不是「直接捏一個像老王的 agent」,而是用足夠的語料「訓練」出一個像老王一樣分析台股的 agent。最完整的語料=夏哥付費訂閱內容。資料不足不訓練(≥50 篇硬閘)。
紀律:圖不離機、付費內容只進私有 NLM、產出為老王方法之模擬、非投資建議。
一、專案定位
| 項目 | 內容 |
|---|---|
| 目標 | 訓練一個用老王(浦惠投顧 王倚隆)方法分析台股的 agent:能力+格式+知識 |
| 路線 | Agent 工程(skill + RAG + 自學迴路),非 fine-tune 模型(官方架構驗證不需要) |
| 語料 | 主:PressPlay 付費每日報告/週晚報;輔:YT「老王不只三分鐘」、公開 FB 貼文 |
| 硬閘 | 累積 ≥50 篇語料才進訓練,避免資料不足就 generalize(反 D4) |
二、六大目標 × 現況 × 缺口
| # | 目標 | 現況 | 還缺什麼 |
|---|---|---|---|
| 1 | 每天產一篇「洞悉全球財經掌握台股主流」文章,像老王 | skill+方法庫雛形 | 文章級整篇模板、每日 cron、完整資料源(三大法人/族群強弱)、語料厚度 |
| 2 | 記錄/反省/追蹤分析過的族群與個股 | 個股時間線骨架(L1) | capture hook、5 欄 schema、L2 instinct+consolidate+verifier、族群級 |
| 3 | 給股票代號就分析+調出過去分析資料 | skill 讀時間線、cnyes 驗代號 | RAG DB 資料量(要 backfill 才調得出) |
| 4 | 不要我截圖,computer-use 每日截 | 已決:夏哥手動截圖 | (改由夏哥截、agent 解讀入庫) |
| 5 | 圖要進資料庫 | 本機 Vision OCR + NLM 方案就緒 | 持續 backfill、圖庫索引規範 |
| 6 | 對焦老王分析法(同/異) | 抓到 COMMON+部分 CONDITIONAL | per-股/per-族群 profile 結構化(=L2 缺口,待語料校正) |
三、老王分析法模型(待驗假設,Phase B 用語料校正)
COMMON 層(每檔都看)
- 均線體系:5 日(短線強弱)/10 日(波段)/月線(中線防守)/季線/20 週(大型權值)
- 量能:有量才有價、不怕爆量怕量縮、爆大量低點=關鍵支撐
- 術語型態:四海遊龍(站回所有均線·多)↔三聲無奈(跌破3短均線·空)、三陽開泰(站上3短均線)、前高壓力、海闊天空(突破前高無壓)、窮多極少(跌破爆量低點·反轉)
CONDITIONAL 層(依股性不同,這層=L2 instinct)
| 股性 | 老王主看 | 例 |
|---|---|---|
| 外資連動股 | 三大法人/外資連續買賣超 | 聯電2303、南亞科2408、至上8112 |
| 獲利爆發股 | 自結 EPS/年增率 | 華邦電2344、旺宏2337 |
| 國際連動股 | 看大作小、龍頭臉色 | 記憶體看美光 MU |
| 大型權值股 | 20 週均線 | 台積電 |
| 分盤處置股 | 無法看量、改看均線 | 力積電6770 |
此表是 1 影片+截圖萃取的 v0 假設,Phase B 由 ≥50 篇語料重建/校正,非定論。
四、系統架構(四層+兩子系統)
laowang plugin (CLI 版優先,不吃 SDK credit) ├─ 知識層:方法庫(vault SSoT) + 術語/均線/籌碼/紀律 ├─ 能力層:laowang-analyst skill(單檔互動) + Dynamic Workflow(批量/建庫) │ dynamic context injection !`cnyes 即時盤面` ├─ 格式層:老王輸出模板(大盤→美股→族群→逐檔→紀律, 先預告後印證) └─ 防護層:hooks 強制 非投資建議 + 來源引用 子系統 B — RAG DB(NLM, 省 token):所有語料 STT/檢索, notebooklm ask 子系統 C — 個股/族群時間線(連續追蹤):每次分析 append, 下次先讀
五、自我學習設計(L1→L4,源自 self-improving agent 藍圖)
L1 Raw(時間線/transcript) ─萃取→ L2 Instinct(老王規則+confidence)
情境→方法→結果→原因→建議 隨實績 decay/升, 跨股 promote
↑capture(便宜,每次) ─聚類→ L3 Skill(方法庫)
↓consolidate(貴,dual-gate,背景) ─抽象→ L4 Strategic(老王策略準則)
Verifier(獨立模型): 校忠實度(NLM RAG) + 信心校準 ← 重用 cross-model, 不 self-judge
MVP 5 步:①L1 有 → ②deterministic capture hook → ③固定 5 欄 schema → ④capture≠consolidate → ⑤獨立 verifier。
六、三階段 + 硬閘
Phase A【語料累積】≥50 篇 ← 現在
截圖(夏哥) → 本機 Vision OCR → NLM RAG + 圖庫 + 結構化記錄 + 個股時間線
│
════ 硬閘:未滿 50 不進 B ════
│
Phase B【訓練】從語料萃取 COMMON+CONDITIONAL per-股 profile → L2 instinct → cross-model 驗證
│
Phase C【交付】每日產文 + 族群/個股追蹤 + 給代號就分析調歷史
七、現況進度(2026-06-03)
語料:76 篇(已過 50 閘)
| 來源 | 量 | 狀態 |
|---|---|---|
| 老王不只三分鐘 YT 2026 | 75 部 | NLM RAG ready(核實 75/0 error) |
| 截圖日報 | 1 篇 | 已解讀入庫(2026-06-01) |
已建工具/資產
vision-ocr.swift:本機繁中 OCR(圖不離機,準度勝 STT)laowang-ocr.sh:批次截圖→corpuslaowang-yt-ingest.sh:resumable YT 批次灌 NLMlaowang-ingestskill:截圖解讀入庫四寫流程laowang-analystskill:互動單檔分析- vault:方法庫 11 篇 + _corpus + 個股時間線 + _PROGRESS(76)
八、技術棧核實(2026-06,live,非記憶)
| 元件 | 版本/狀態 | 用途 |
|---|---|---|
| Claude Code | v2.1.160 | 主機 |
| Dynamic Workflows | v2.1.154 GA | 批量建庫/全盤掃描 |
| Skills(dynamic injection/subagent/progressive) | docs 核實 | agent 能力封裝 |
| macOS Vision OCR(swift 6.2.4) | 本機 | 繁中 OCR,圖不離機 |
| NotebookLM CLI | 私有 Pro | RAG DB(省 token) |
| cross-model(codex+gemma) | §4 | verifier 分離 |
| fine-tune | ❌ 不採 | 官方架構 skill/prompt-based |
九、風險與紀律
- 圖不離機:付費截圖用本機 Vision OCR,只有萃取文字進私有 NLM;不上第三方 OCR 雲。
- 著作權:付費文有電子浮水印追蹤,僅個人自用、不對外散布;萃取方法+數據點,非逐字重製。
- 非投資建議:全程只記錄/模擬老王方法,不下買賣建議。
- 反 D4:資料不足不下方法定論;≥50 篇才訓練;confidence 隨實績校準。
- verifier 分離:實作≠評審,重用 cross-model,避免 LLM 過度自信。
十、下一步(待夏哥定)
1. 補 PressPlay 付費每日報告截圖(最完整主語料)→ 我 OCR 解讀入庫,或
2. 直接用現有 76 篇先跑 Phase B 訓練,看老王方法模型雛形,再決定加料。
相關:_MOC 浦惠老王 方法論研究、_SPEC 老王研究 + SOP差異點日誌、laowang-analyst、laowang-ingest
⚠️ 非投資建議
本網站所有內容均為研究輔助用途,不構成買賣有價證券之建議。投資一定有風險,投資前請詳閱公開說明書。
老王 Agent © 2026 · 基於公開影片分析萃取 · 浦惠證券老王方法論研究
本網站所有內容均為研究輔助用途,不構成買賣有價證券之建議。投資一定有風險,投資前請詳閱公開說明書。
老王 Agent © 2026 · 基於公開影片分析萃取 · 浦惠證券老王方法論研究