Tsukino Dev Notes

❯

LLM 基础

2026年5月24日1分钟阅读

LLM 基础

本领域覆盖大语言模型的核心原理与基础技术。

核心主题

Why We Think — Test-Time Compute 与推理能力 —— Lilian Weng 经典文章笔记
Transformer 架构
Attention 机制
预训练与微调
Tokenization

参考翻译

Why We Think 中英对照

待补充笔记

随着学习深入，逐步补充具体笔记内容。

此文件夹下有5条笔记。

2026年5月24日
prompt-engineering-lilian-weng
2026年5月24日
why-we-think-test-time-compute
2026年5月24日
extrinsic-hallucinations
2026年5月15日
LLM 上下文压缩策略全景对比
2023年10月12日
MemGPT: Towards LLMs as Operating Systems

最近更新

源码仓库镜像
2026年5月24日
Tsukino Dev Notes
2026年5月24日
_navbar
2026年5月24日
_sidebar
2026年5月24日
SKILL
2026年5月24日

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community