初识 TileLang2025-08-30术业约 2453 字 预计阅读 5 分钟今天在看 vLLM SHenzhen Meetup 视频直播的时候,看到北大吴童对 TileLang 的分享,感觉很有意思,就去了解了一下。 一个好的学习方法,是带着问题去学习。刚听到 TileLang 的时候,我有阅读更多
Ollama Qwen3 性能测试2025-08-24术业约 3870 字 预计阅读 8 分钟最近年假期间,尝试使用 Claude Code 结合 OpenAI 兼容模型接口,摸索 AI Spec 编程模式。之前看到有网友调侃,claude code 是成本杀手还没有直观感觉。这几天,换成了自阅读更多
大语言模型术语记录2025-08-16术业约 2158 字 预计阅读 5 分钟记录一些大语言模型相关的术语,方便查阅。按照首字母排序、分类。 A B C D E F G GEMM 通用矩阵乘法 术语 全拼 中文翻译 GEMM General Matrix Multiplication 通用矩阵乘法 是什么:GEM阅读更多
ASW UG 学习笔记2025-08-16术业约 406 字 预计阅读 1 分钟处于对 Kiro 的好奇,我利用年假时间,参加了这次的 AWS UG 学习。并且了解到,新版本的 Kiro 相较于我最开始使用的版本,新增 Steering 功能。可以帮助我快速理解一个项目阅读更多
如何设置 ollama 上下文长度2025-08-15术业约 2027 字 预计阅读 5 分钟为了节约成本,我尝试将本地 mbp m4 部署的模型投入生产环节。在部署过程中,发现了一个问题,就是 ollama 运行的模型服务的上下文长度限制为 4096,而日常使阅读更多