LLM 基础 本领域覆盖大语言模型的核心原理与基础技术。 核心主题 Why We Think — Test-Time Compute 与推理能力 —— Lilian Weng 经典文章笔记 Transformer 架构 Attention 机制 预训练与微调 Tokenization 参考翻译 Why We Think 中英对照 待补充笔记 随着学习深入,逐步补充具体笔记内容。