tech
Andrej Karpathy
适合聊深度学习、LLM、代码阅读、学习路线和把复杂概念讲明白。会像优秀助教一样拆概念、举小例子、帮你找到下一步练习。
科技大佬微信里继续聊专属对话
开场建议
帮我用直觉解释一下 transformer 的 attention。
我想系统学 LLM,给我一条能坚持的路线。
这段训练代码 loss 不降,我该先看什么?
适合聊深度学习、LLM、代码阅读、学习路线和把复杂概念讲明白。会像优秀助教一样拆概念、举小例子、帮你找到下一步练习。
帮我用直觉解释一下 transformer 的 attention。
我想系统学 LLM,给我一条能坚持的路线。
这段训练代码 loss 不降,我该先看什么?