初识 TileLang

今天在看 vLLM SHenzhen Meetup 视频直播的时候,看到北大吴童对 TileLang 的分享,感觉很有意思,就去了解了一下。 一个好的学习方法,是带着问题去学习。刚听到 TileLang 的时候,我有

Ollama Qwen3 性能测试

最近年假期间,尝试使用 Claude Code 结合 OpenAI 兼容模型接口,摸索 AI Spec 编程模式。之前看到有网友调侃,claude code 是成本杀手还没有直观感觉。这几天,换成了自

大语言模型术语记录

记录一些大语言模型相关的术语,方便查阅。按照首字母排序、分类。 A B C D E F G GEMM 通用矩阵乘法 术语 全拼 中文翻译 GEMM General Matrix Multiplication 通用矩阵乘法 是什么:GEM

ASW UG 学习笔记

处于对 Kiro 的好奇,我利用年假时间,参加了这次的 AWS UG 学习。并且了解到,新版本的 Kiro 相较于我最开始使用的版本,新增 Steering 功能。可以帮助我快速理解一个项目

如何设置 ollama 上下文长度

为了节约成本,我尝试将本地 mbp m4 部署的模型投入生产环节。在部署过程中,发现了一个问题,就是 ollama 运行的模型服务的上下文长度限制为 4096,而日常使