# 从安徽小镇到硅谷融资桌：这个华人大三学生，凭什么拿到 1100 万美元？

- 状态 / Status: 已发布 / Published
- 时间 / Time: 2026-05-03T00:05:55+08:00
- 作者 / Author: -
- 主题 / Topics: AI / AI
- 原文 / Source: https://mp.weixin.qq.com/s/GcHEy9h-3NJbiu138ocsug

一个从普通农村家庭走出来的中国学生，用 AI 把美国昂贵的一对一家教打成了几美元一次的产品，然后在不到半年时间

---

![图片](https://mmbiz.qpic.cn/sz_mmbiz_png/Yiar2Yf8dkWsBOHIFUibicOklXBfgIL1h6tt4HZ3O4iaqdqdMwbJKpg96dibRJplGh2nQfn6O9MicKdPKp3o0p31IHwEEbCbMRosXpD4qsLENqPDA/640?wx_fmt=png&from=appmsg#imgIndex=0)

一个从普通农村家庭走出来的中国学生，用 AI 把美国昂贵的一对一家教打成了几美元一次的产品，然后在不到半年时间里拿到 1100 万美元种子轮。

核心是这五个钩子：

第一，命运钩子：家境有限、农村出身、靠编程和科创打开第一扇门。

第二，产品钩子：不是普通 AI 搜题，而是 AI 生成动画讲题视频。

第三，市场钩子：美国 SAT/AP 备考、一对一家教很贵、学生和家长有强付费意愿。

第四，技术钩子：LLM + Manim/动画渲染管线 + 几何解析 + 多模型校验，解决数学图像和步骤讲解的准确性问题。

第五，资本钩子：YZi Labs 首次 AI 软件投资，1100 万美元种子轮，团队拿到多个 term sheet。(YZi Labs)

维度

可写事实

注意事项

人物

赵凯 / Kai Zhao，VideoTutor 创始人

年龄公开资料有冲突：YZi Labs 写 20 岁，36氪标题写 22 岁，阜阳本地报道写 1999 年出生。建议正文写年轻创业者或华人大三学生，不要把年龄写死。(YZi Labs)

出身

安徽普通农村家庭，家境有限，高中开始学习计算机

“废品站出生”暂未找到权威来源，建议只作为传播标题的隐喻，不作为事实陈述。(FYNews)

学校

曾就读美国圣何塞州立大学；阜阳日报写数学专业，36氪写 2023 年进入 SJSU

“全奖”暂未找到可靠来源。(FYNews)

早期经历

高中学习 C、C++、Swift；发明手语翻译手套，获第 47 届日内瓦国际发明展银奖；大二时创办 Shake Shake 并获 10 万美元投资

这是非常好的“能力不是一夜长出来”的铺垫。(搜狐)

VideoTutor

AI 教育 Agent，可把问题转成个性化动画讲解视频，面向 K12、SAT/ACT、STEM 等

不要写成普通搜题 App，它的差异点在可视化教学。(YZi Labs)

融资

1100 万美元种子轮，YZi Labs 领投，锦秋基金、百度风投、Amino Capital、BridgeOne Capital 等参投

这是文章最硬的数据锚点。(YZi Labs)

增长数据

YZi Labs 写上线 10 天超过 2 万用户、生成 2 万+视频、收到 1000+ API 集成请求；36氪写上线 20 天注册用户超 3 万、播放量破千万、生成超 10 万条视频

可以写成不同时间窗口的数据，不要混成一个数据。(YZi Labs)

![图片](https://mmbiz.qpic.cn/mmbiz_png/Yiar2Yf8dkWvz6fCRb3FHFGiaNttDZiaGEtCVSdvSlqjqIhspc0dia3ic9mDzjmVchsT9QLt9VcoEZrsICiagGWEJSndVojzZSQx4H89k5AsKicPsE/640?wx_fmt=png&from=appmsg#imgIndex=1)

他的故事不是爽文，而是 AI 时代最典型的一条创业公式：高付费痛点、强技术拐点、小团队极速迭代。

很多人第一次听到赵凯的故事，会下意识把它写成一个逆袭剧本。

安徽普通农村家庭出身，家境有限，高中开始学计算机，后来去了美国，在大学期间连续创业，最后做出一个 AI 教育产品，拿到 1100 万美元融资。

听起来像小说。

真正厉害的，不是他从哪里来，而是他看见了一个大多数人没看懂的机会：美国学生不是不想学数学，而是请不起足够好的老师；AI 不是只能给答案，而是可以把老师在白板上讲题的过程，变成一个即时生成的视频。(FYNews)

赵凯做的 VideoTutor，表面上是一个 AI 解题应用。学生拍照或者输入一道题，系统会生成带动画、语音和步骤拆解的讲解视频。它不是简单告诉你答案是多少，而是尽量模拟一个老师在白板前一步步讲清楚：函数图像怎么动，几何图形怎么标，推理为什么这样走。36氪报道中提到，VideoTutor 当前主要瞄准 SAT、AP 等标准化考试题目，生成一条完整视频大约需要 60 到 90 秒。(36氪)

这就是它和普通“拍照搜题”的分水岭。

普通搜题 App 解决的是：快点告诉我答案，我好交作业。

VideoTutor 想解决的是：我真的想学会，能不能像老师一样给我讲一遍？

这两个需求看起来接近，商业价值完全不同。前者很容易被 ChatGPT 这类通用大模型吃掉，因为只要答案够快、够便宜，用户就会迁移。后者更难，因为它牵涉到图像、步骤、语音、节奏、互动、准确性和学习动机。赵凯在接受 Founder Park 采访时就提到，VideoTutor 面向的是主动学习场景，比如 SAT、AP 备考；学生不是为了糊弄作业，而是必须真正掌握知识点。(BlockBeats)

创业最怕的，不是没有故事。

创业最怕的是只有故事，没有痛点。

而 VideoTutor 的痛点很硬。

YZi Labs 的官方文章写到，美国每年有 200 多万学生参加 SAT，线下一对一家教每小时通常要 60 到 90 美元，很多学生没有个性化辅导资源。36氪则在采访中写到，美国线下家教可达到每小时 100 到 400 美元，而 VideoTutor 目前生成 4 条视频收费 3.99 美元。两个数字口径不同，但指向同一个现实：传统个性化辅导太贵，AI 有机会把成本打下来。(YZi Labs)

这也是赵长鹏旗下 YZi Labs 愿意出手的原因之一。

YZi Labs 官方披露，VideoTutor 完成 1100 万美元种子轮融资，这是 YZi Labs 扩展投资范围后首次投资 AI 软件公司；这轮融资由 YZi Labs 领投，锦秋基金、百度风投、Amino Capital、BridgeOne Capital 等参投。官方还写到，VideoTutor 上线 10 天内达到 2 万+用户，生成 2 万+视频，并收到全球教育机构和学习平台 1000+ API 集成请求。(YZi Labs)

一个年轻团队能打动资本，不只是因为年轻。

更因为它同时踩中了三个窗口。

第一个窗口，是需求窗口。

教育一直是高付费市场。尤其是考试教育，家长不是为知识付费，而是为孩子的机会付费。SAT、AP 这种场景，有明确目标，有明确考试周期，有明确结果反馈。用户不是“有空学学”，而是“我必须提分”。这种需求，比泛泛而谈的 AI 学习助手更锋利。

第二个窗口，是技术窗口。

过去 AI 可以写文字、给答案，但很难把数学、几何、函数这些知识点可视化讲清楚。VideoTutor 的做法不是直接用扩散模型生成一段漂亮视频，而是把大语言模型和数学动画渲染管线结合起来。YZi Labs 文章提到，VideoTutor 使用 LLM + Manim 渲染管线，配合 Layout Manager 和容错系统，解决公式、图表、科学概念等结构化内容的语义精准和视觉清晰问题。36氪也写到，团队内置几何解析器，把三角形、平面几何、线形等图形转化成模型能理解的机器语言，并重写动画引擎渲染协议，减少元素错位。(YZi Labs)

第三个窗口，是组织窗口。

这支团队不是拿着 PPT 找钱。赵凯在高中就开始学 C、C++、Swift，做过手语翻译手套，后来在美国读书期间连续创业。阜阳日报报道过，他大二时在硅谷成立公司 ShakeShake Inc，并获得 10 万美元天使投资；36氪则写到，他大一做过大学生恋爱 App，拿过 20 万美元融资，后来项目失败，大二又参与 MathGPT Pro，直到第三次创业才转向 VideoTutor。(搜狐)

所以这不是“突然天降 1100 万美元”。

这是一个年轻人试错、失败、换方向、再试错，最后在一个正确窗口撞上正确技术的结果。

很多人看学生创业，会先问：他学历够不够？学校够不够名？年龄够不够大？

资本问的是另一件事：你是不是比别人更接近用户？你是不是比别人更快？你是不是已经证明有人愿意用、愿意付费、愿意传播？

在 Founder Park 的访谈中，赵凯提到团队已经收到大量 API 请求，也有家长和学生表现出强付费意愿；团队的判断是，AI 生成视频如果和老师录制的在线课程差异不大，却成本更低、反馈更即时，就会发生需求迁移。(BlockBeats)

这句话其实很关键。

真正的 AI 创业，不是给旧产品套一个 AI 外壳。

而是找到一个旧流程里最贵、最慢、最依赖人工的环节，然后问一句：如果 AI 能做到 80 分，用户会不会立刻换过来？

对于 VideoTutor 来说，旧流程是老师备课、画图、录屏、讲解、反复答疑。

新流程是学生输入题目，AI 自动生成动画讲解，还能继续追问。

这不是工具替代工具。

这是成本结构替代成本结构。

36氪提到，以往老师用几何画板、PPT 或其他可视化工具准备一小时视频课，可能还需要一到两小时后期制作；而在 VideoTutor 里，从学生输入问题到生成完整视频，只需要 60 到 90 秒。(36氪)

当然，这家公司也不是没有风险。

第一，教育场景对准确率极其敏感。一道数学题讲错一次，用户信任就会掉一次。36氪报道中提到，VideoTutor 使用 Claude 和 Gemini 两层模型校正难题，答案一致才输出，并让 SAT、AP 高分学生标注 AI 生成视频中的错误，用真实反馈继续训练模型。(36氪)

第二，大模型公司随时可能下场。ChatGPT 已经推出 Study mode，未来通用模型可能越来越擅长教学。赵凯对这个问题的判断是：大模型公司的核心使命是 AGI，不太可能在所有细分教育场景重兵投入，应用层公司仍有生态位，关键是比大厂更懂教育和学生。(36氪)

第三，增长数据必须转化成真实留存和提分结果。Founder Park 访谈里，赵凯说 B2C 口碑是关键指标，核心要看多少 SAT 考生用产品提分，然后愿意分享给学生和家长。这个判断很清醒，因为教育产品最终不是比谁 Demo 更酷，而是比谁能让学生真实进步。(BlockBeats)

所以，赵凯这个故事真正值得写的地方，不是“他穷过”。

苦难本身不产生商业价值。

商业价值来自一个人有没有把自己的痛苦翻译成别人的痛点，再把痛点翻译成产品，再把产品翻译成增长。

很多人也穷过，也被拒过，也想翻身。

但赵凯把这条路往前推了一步：他没有只停留在“我要改变命运”，而是把“教育为什么这么贵”变成了一个产品问题。

这才是他最锋利的地方。

一个人要从命运里飞出来，光靠热血不够。

热血只能让你熬夜。

洞察才能让你选对方向。

技术才能让你做出东西。

速度才能让你抢到窗口。

资本只会在最后出现，把已经形成的势能放大。

赵凯的故事，不是告诉普通人“你也能随便融 1100 万美元”。

那是鸡汤，是骗人的。

它真正告诉我们的是：AI 时代的创业门槛正在变化。过去你要很多人、很多钱、很多年，才能做一个教育产品；现在，一个极小团队，如果抓住足够具体的痛点，做出足够强的 Demo，拿到足够快的用户反馈，就有机会在几个月内被资本看见。

但前提是，你得真的解决问题。

不是写一个“AI 教育平台”的宏大愿景。

而是先让一个学生，把一道不会的数学题，看懂。

苦难不是护城河，把苦难翻译成产品的人，才有护城河。

AI 创业不是给旧产品套一层模型，而是重写旧行业的成本结构。

普通搜题解决的是交作业，VideoTutor 想解决的是学明白。

资本不是奖励梦想，资本奖励已经形成的势能。

寒门最怕的不是没资源，而是把“没资源”当成永恒借口。

真正的逆袭不是逃离出身，而是把出身给你的痛感，炼成别人愿意付费的洞察。

照这个案例拆一套创业方法

第一步，别先问“我能做什么产品”，先问“哪个旧流程又贵又慢又痛”。

VideoTutor 找到的是美国一对一家教和备考讲题。它贵，慢，依赖人，而且用户有强结果需求。

第二步，选一个极窄场景，不要上来做“全世界的 AI 老师”。

先做 SAT/AP 数学和 STEM 讲题，因为这里有标准化题目、明确用户、明确付费者、明确评价标准。

第三步，找 AI 比人便宜 10 倍但体验接近人的环节。

不是所有环节都适合 AI。适合 AI 的环节通常有这几个特征：重复、可标准化、人工成本高、用户容忍轻微等待、结果能被验证。

第四步，用 Demo 打市场，不要用 PPT 打市场。

VideoTutor 的传播核心是把 AI 生成视频和真人教学视频放在一起，让用户直接感受到“这东西能用”。

第五步，先拿真实用户反馈，再谈融资。

核心指标不是媒体曝光，而是用户是否看完、是否复用、是否付费、是否推荐、是否产生 B 端合作请求。

第六步，做技术护城河时，别只靠大模型。

VideoTutor 的关键不是“调用一个模型”，而是几何解析、动画渲染、布局管理、模型校验、真实样本标注这些组合能力。

第七步，小团队要快，但不能乱。

早期团队最好 5 到 10 人，所有人围绕一个核心指标跑。赵凯团队被多篇报道描述为小团队、高频迭代，这正是早期创业的优势。(36氪)

第八步，融资不是目的，是势能放大器。

当产品已经有用户、增长、付费意愿和机构需求时，融资才会变成加速器。否则融资就是拿钱买焦虑。

商业分析检查：

- 用户是谁：SAT/AP/K12/STEM 学生。
- 付费者是谁：学生、家长、机构。
- 替代谁：线下家教、线上录播课、部分搜题工具。
- 差异点是什么：可视化、个性化、动画讲解、低成本。
- 护城河是什么：数据飞轮、动画引擎、教育场景理解、品牌信任。
- 最大风险是什么：准确率、大模型平台下场、教育效果验证。

## 5W2H 框架

项目

内容

Who，谁

赵凯 / Kai Zhao，VideoTutor 创始人，华人大三学生创业者；团队包括 James Zhan 等。公开资料对年龄有冲突，建议写年轻创业者，不写死年龄。(YZi Labs)

What，做什么

VideoTutor，一个 AI 教育 Agent，把学生输入的问题转成个性化动画讲解视频，面向 K12、SAT/ACT、STEM 等学习场景。(YZi Labs)

When，什么时候

产品 2025 年 5 月上线；随后在数月内完成 1100 万美元种子轮融资。(YZi Labs)

Where，在哪里

美国硅谷 / 圣何塞相关创业生态；赵凯曾就读圣何塞州立大学。(FYNews)

Why，为什么能成

备考辅导贵、学生需要个性化讲解、可视化学习难、AI 技术窗口成熟、小团队迭代快、资本愿意押注 AI 教育应用层。(YZi Labs)

How，怎么做

用 LLM 生成讲解脚本和动画指令，再通过数学动画渲染引擎生成图像、语音和视频；同时用几何解析、多模型校验、样本标注来提高准确率。(BlockBeats)

How Much，多少钱

1100 万美元种子轮；产品端据 36氪报道，首次生成免费，之后 4 条视频 3.99 美元。(YZi Labs)
