- 新增 embeddingRetrieval.ts:TF-IDF 向量检索引擎(内存模式) - 新增 regulatoryCrawler.ts:自动爬虫模块(SEC/SFC/MAS/DFSA/ESMA/HKEX等) - 修复 ragRetrieval.ts:NaN% 相关度 bug(5处修复) - 升级 ragRetrieval.ts:集成语义向量检索(策略5,混合检索) - 扩展知识库:78条规则(17辖区×13资产类别) - 新增脚本:expandKnowledgeBase.js(22条新规则) MongoDB 规则统计: 总计:78条(旧格式35条 + 新格式43条) 辖区:US/SG/CN/GLOBAL/EU/AE/HK/JP/AU/CH/GB/KR/IN/MY/TH/BR/ZA 资产类别:RealEstate/Equity/DigitalAssets/CarbonCredits/Bonds/IP/Commodities/Infrastructure/Agriculture等 Bug 修复: NaN% 根因:total=0时 idx/0=NaN,已修复5处 textScore 归一化:0-10范围映射到0-1 baseScore 传递:各检索策略均传入合理基础分 |
||
|---|---|---|
| .. | ||
| WORKLOG_20260301_爬虫体系升级_向量检索_NaN修复.md | ||