DeGao
2025-07-01 22:43:11
RWKV路线
优势
代码简洁(1000行 vs Mamba 5000行)
社区活跃,易于上手
工程成熟度高,训练稳定
劣势
理论不够优雅
长程依赖能力弱于Mamba
学术认可度低
Mamba路线
优势
选择性机制是核心突破
理论基础扎实(控制论)
性能上限更高
劣势
实现复杂,需要深厚数学功底
调试困难,黑盒程度高
人才稀缺,全球不足1000人精通
我认为短期赢家是Transformer,但是中期赢家应该是混合架构,最终赢家永远是解决实际问题的人,而不在于理论或短期优势,VHS战胜Betamax不是因为技术更好,而是因为生态更强。 架构之争最后也可能不是技术决定,而是生态、成本和路径依赖决定。
谁会成为主流?
不是单一架构胜出,而是混合架构
短期看Transformer,中期看混合,长期看创新
技术优势 < 生态优势 < 解决实际问题
最大的机会
现在是最好的时机:大厂的傲慢创造了窗口期
不在于选择架构:在于如何组合和优化
真正的赢家:谁能让AI真正"无限且即时"