YouTube Video — Transcript

本视频系统讲解Codex从安装到高级功能,结合10个实战场景,助力零基础用户高效使用AI Agent工具。

Key Takeaways

  • Codex适合零基础用户,操作友好且功能强大,特别是在本地文件管理和自动化办公方面。
  • Cloud Code功能齐全但更新较慢,更适合专业开发者使用。
  • Codex支持多种权限模式,保障用户数据安全同时提升AI操作自由度。
  • 通过自然语言指令,Codex能自动安装依赖和执行复杂任务,极大提升工作效率。
  • Codex具备完善的记忆系统,支持任务连续性和个性化定制。

Summary

  • 介绍Codex与Cloud Code的本质区别及各自优势,适合不同用户需求。
  • 详细演示Codex的安装流程及基础设置,支持OpenAI GPT模型。
  • 通过10个实战场景,展示Codex在本地文件操作、视频素材管理、自动命名等方面的强大能力。
  • 讲解Codex的权限管理模式,包括默认权限、自动审查和完全访问权限。
  • 展示Codex如何结合命令行工具(如FFMPEG)完成复杂任务,如视频剪辑和文件处理。
  • 介绍Codex的记忆系统,包括手动持久记忆agents.md和自动记忆机制,提升任务连续性。
  • 强调Codex在办公场景中的执行力和解决问题能力,适合零基础白领用户。
  • 对比Cloud Code更适合专业开发者,Codex更注重易用性和快速迭代。
  • 演示如何通过自然语言指令安装依赖和技能,简化复杂操作流程。
  • 分享探索AI工具的独门秘方,鼓励用户主动尝试和学习。

Full Transcript — Download SRT & Markdown

00:00
Speaker A
美好啊,朋友们,这是一期Codex奶妈级的零基础系统教程。这期视频我会从安装开始,手把手地把Codex的基础能力到高级功能的组合,以及最新的手机端操作,用10个实战场景来带大家彻底拉通。以后这类Agent产品,出一个算一个,你都能出类拔萃,游刃有余。我也把这期的文字课整理成了文档,大家评论区见了。
00:16
Speaker A
10 个 实战 场景 来 带 大家 彻底 拉通 以后 这 一类 的 Agent 产品 出 一个 算 一个 你 都 会 出类 旁通 游刃 有益 我 也 把 这期 的 文字 课简 整理 成 了 文档 大家 评论 区见 了
00:29
Speaker A
那这期的含金量可谓是一个点赞、收藏、关注是最奇滑的。好了,不多说,学费都交了吧,我们上课。那在开始之前,我先说一下Codex和Cloud Code的区别。
00:46
Speaker A
从 本质 上 来说 它 俩 都 是 由 编程 Agent 逐步 转向 了 通用 Agent 的 分别 是 Anth ropic 和 OpenAI 这 两家 出 的 Cloud Code 默认 使用 Cloud 模型 但是 我们 可以 自行 替换成 任意 其他 的
01:00
Speaker A
从本质上来说,它俩都是由编程Agent逐步转向了通用Agent,分别是Anthropic和OpenAI这两家出的。Cloud Code默认使用Cloud模型,但是我们可以自行替换成任意其他的模型。那Codex桌面端只支持OpenAI的GPT模型。
01:13
Speaker A
在 功能 上 Cloud Code 原本 是 最 齐全 的 什么 Skill , MCT 斜杠 命令 , Hawk 远程 操控 这 都 是 人家 先 发明 的 但是 呢 最近 的 CC 更新 稍微 不如 Codex 那么 快 了 会
01:26
Speaker A
那在易用程度上,Codex桌面端的产品设计会更友好,更适合零基础的白领工作者,而Cloud Code有更高的自由度。
01:40
Speaker A
手机 Chat GPT 来 控制 电脑 上 的 Codex 干活 那 价格 和 额度 方面 呢 Codex 的 会员 额度 非常 大方 20 道 的 会员 就 很 够用 而且 还 不 封号 而 Cloud Code 呢 大多数 人 可能
01:53
Speaker A
在功能上,Cloud Code原本是最齐全的,什么Skill、MCT斜杠命令、Hawk远程操控,这都是人家先发明的。但是呢,最近的Cloud Code更新稍微不如Codex那么快了,会更加偏向专业开发者一点。而Codex发了非常强的浏览器操控和Computer Use,还内置了最近的Image 2深图模型,而且昨天还刚刚发布了手机端和Hawk,可以直接用你的手机ChatGPT来控制电脑上的Codex干活。
02:06
Speaker A
4.6 的 写作 和 规划 能力 真的 很强 那 Codex 的 执行 和 解决问题 的 能力 也 很 强 日常 的 办公 场景 我会 选择 用 Codex 那 在 编程 的 时候 嘛 我 就 两个 都 用 上 所以
02:19
Speaker A
那价格和额度方面呢,Codex的会员额度非常大方,20刀的会员就很够用,而且还不封号。而Cloud Code呢,大多数人可能都没法用,它的官方账号基本上都得自行调用API,费用属于花多少用多少,封号尤人。
02:30
Speaker A
了 那 Cloud Code 我 也 做 了 一期 系统 教程 想 拥有 左膀右臂 的 朋友 可以 去 看看 OK 正式 开始 使用 Codex 我们 唯一 需要 准备 的 就是 一个 Chat GPT 账号 免费 的 也 行 只是 会
02:43
Speaker A
那在使用场景上,我个人喜欢用Cloud Code搭配Cloud模型来写作,因为GPT-4.6的写作和规划能力真的很强。那Codex的执行和解决问题的能力也很强,日常的办公场景我会选择用Codex。那在编程的时候嘛,我就两个都用上。
02:58
Speaker A
后续 我们 都 是 可以 改 的 搞定 了 进来 之后 大家 会 看到 对话 窗口 好像 跟 Chat GPT 是 很 类似 的 那 我们 打开 两边 的 侧边 栏 也 蛮 眼熟 的 左边 可以 管理 对话 和
03:12
Speaker A
所以结论是,入门的朋友用Codex就很强了,有条件的朋友呢,两个都用是最完美的。不过两者的逻辑其实都是一样的,我们学一个,另一个也就会用了。
03:25
Speaker A
工具 的 独门 秘方 我 打开 一个 陌生 界面 我先 不管 别的 我先 找到 我能 对话 的 框 我 先聊 先 找到 我能 看得懂 的 按钮 先 按 按着 按着 你 就 会 了 你 看看 独门 秘籍 都 交给
03:39
Speaker A
那Cloud Code我也做了一期系统教程,想拥有左膀右臂的朋友可以去看看。OK,正式开始使用Codex,我们唯一需要准备的就是一个ChatGPT账号,免费的也行,只是额度稍微少一点。
03:56
Speaker A
AI 最 显著 的 区别 和 能力 因为 过去 我们 用 Chat GPT 如果说 我们 要 让 它 看到 我们 本地 的 内容 我们 只有 两种 方式 一个 就是 复制粘贴 到 对话 里 另 一种 就是 以 它 允许 的 格式
04:10
Speaker A
有了账号之后,我们就直接去它的官网双击安装,然后安装好之后登录我们的ChatGPT账号。然后这些设置我们可以先随便选一点,选个日常工作,反正后续我们都是可以改的。搞定了进来之后,大家会看到对话窗口,好像跟ChatGPT是很类似的。
04:25
Speaker A
素材 这 都 是 我 剪辑 要用 的 但是 这个 命名 全都 是 乱 的 完全 看不懂 所以 我 想 以 这些 视频 的 内容 来 命名 到时候 我们 看见 文件名 的 时候 我们 就 知道 这个 素材 是 什么 了
04:38
Speaker A
那我们打开两边的侧边栏也蛮眼熟的,左边可以管理对话和任务的列表,那中间就是聊天,右边大概是结果之类的吧,大家应该都能猜个七七八八。
04:53
Speaker A
只要 选中 这个 文件夹 那 这个 文件 就是 我们 的 项目 了 里面 所有 的 文件 Codex 都 可以 自由 的 读取 和 操作 当然 这 需要 我们 给 它 权限 大家 看 这里 的 权限 选择 目前 我们 是
05:08
Speaker A
所以我们先不深究它的页面,我们直接开用。这其实也是我探索所有AI工具的独门秘方,我打开一个陌生界面,我先不管别的,我先找到我能对话的框,我先聊,先找到我能看得懂的按钮,先按,按着按着你就会了。你看看,独门秘籍都交给大家了,以后你们就是为师的弟子了。
05:22
Speaker A
下载 一点 东西 或者 是 碰 这个 文件夹 之外 的 其他 文件 那 它 是 不行 的 如果 它 必须 要 做 就 会 要 向 我们 提出 提高 权限 的 请求 我们 点 同意 才能 继续 那 自动 审查 呢
05:36
Speaker A
OK,重弟子不必拘礼,我们还是以学业为重。那我们第一个要了解的Codex能力就是本地文件操作,也是这一类桌面端的Agent跟对话AI最显著的区别和能力。
05:48
Speaker A
直接 开干 了 自动 审查 比 默认 模式 要 更 宽松 和 智能 建议 大家 选 这个 就 完 了 那 最后 呢 是 完全 访问 权限 这 意味着 Codex 可以 在 你 的 电脑 上 几乎 什么 都 能干 它
06:01
Speaker A
因为过去我们用ChatGPT,如果说我们要让它看到我们本地的内容,我们只有两种方式,一个就是复制粘贴到对话里,另一种就是以它允许的格式和数量把文件上传上去。
06:12
Speaker A
嫉妒 情绪 妈 那 大家 尤其 是 新手 朋友 就 选择 自动 审查 模式 相信 AI 就 完 了 毕竟 咱 又 能 审 的 比 AI 好 多少 呢 对 吧 OK 那 我们 选中 了 刚刚 的 这个
06:25
Speaker A
但是Codex不一样,它可以自主地读取和操作我们的本地文件,而且不限数量。比如说,我作为一个剪辑,我的本地里面存了80多条视频素材,这都是我剪辑要用的,但是这个命名全都是乱的,完全看不懂。
06:40
Speaker A
的 聪明 他 先 看 了 看 我们 到底 有 多少 个 视频 然后 他 选择 用 抽针 的 方式 抽取 关键 画面 来 判断 内容 是 什么 而且 他 还 知道 他 不要 一张 一张 图去 看 他 给
06:53
Speaker A
所以我想以这些视频的内容来命名,到时候我们看见文件名的时候,我们就知道这个素材是什么了。
07:06
Speaker A
内去 操作 的 那 我们 也 可以 检查一下 他 都 对应 好 了 没有 OK 钢琴 加 音乐 演奏厅 没错 雪山 晋升 格斗 没错 旗袍 女人 夜相卖 热饮 哇 而且 他 的 这个 命名 还 遵循 着 一个 序号 任务
07:26
Speaker A
那这事ChatGPT肯定是做不了的,但是Codex可以。我们来看这两个地方,它都显示了一个概念叫做项目。我们选择一下,一选择项目,它就让我们选择本地的文件夹了。
07:39
Speaker A
不 一样 的 但是 同样 都 可以 随时 的 访问 我们 这个 文件 这个 项目 比如说 我们 在 另外 一条 对话 我们 又 给 他 一个 不同 的 任务 让 他 想 办法 把 所有 关于 风景 的 视频 都
07:53
Speaker A
那我们只要选中这个文件夹,这个文件就是我们的项目了,里面所有的文件Codex都可以自由地读取和操作,当然这需要我们给它权限。大家看这里的权限选择,目前我们是一个默认的权限。
08:08
Speaker A
了 一条 OK 如果 我们 要 创建 一个 新 的 任务 我们 其实 也 可以 手动 的 在 这边 创建 它 也 会 自动 的 在 我们 本地 创建 一个 文件夹 然后 我们 跟 Codex 对话 的 整个 过程 Agent
08:22
Speaker A
我们再点开,它有三种权限模式。那默认权限的意思就是在我们当前的文件夹内,它可以自由地去读写这些文件,但是如果它想要联网,或者是帮我们下载一点东西,或者是碰这个文件夹之外的其他文件,那它是不行的。
08:36
Speaker A
文件 删 文件 移动 文件 文件夹 里 的 内容 也 就 成 了 我们 的 codex 随时 可以 获取 的 上下文 那 这里 的 项目 也 就 对应 着 我们 在 本地 的 一个 文件夹 诶 那 刚刚 这么 个
08:51
Speaker A
如果它必须要做,就会向我们提出提高权限的请求,我们点同意才能继续。
09:07
Speaker A
鼠标 悬 上去 呢 它 还 会 有 更 详细 的 一个 信息 当 上下文 快满 的 时候 Codex 会 自动 的 帮 我们 压缩 上下文 不过 其实 当 我们 一个 任务 告一段落 之后 不用 等 它 快满了 让 它
09:20
Speaker A
那自动审查呢,顾名思义,就是有个AI自动帮我们审查,由AI来判断这个操作危不危险。如果危险呢,就来问我们;不危险的,比如说它去下一个知名的这种官方软件什么的,它就直接开干了。
09:34
Speaker A
这个 对话 的 上下文 语量 其实 我们 还 想 知道 我 作为 一个 免费 用户 或者 是 我 作为 一个 Pro 用户 plus 会员 我 还有 多少 总共 的 额度 可以 用 对 吧 这个 呢 有 两个 方式 查看
09:48
Speaker A
自动审查比默认模式要更宽松和智能,建议大家选这个就完了。
10:00
Speaker A
这个 产品 的 设计 还是 比 Cloud 友好 很多 的 那 另 一种 方式 呢 就是 我们 可以 直接 在 对话框 里 输入 斜杠 然后 找到 这个 状态 那 打开 这个 状态 之后 它 的 绘画 这里 就 会 持续
10:13
Speaker A
那最后呢,是完全访问权限,这意味着Codex可以在你的电脑上几乎什么都能干。它可以修改、删除任何文件,它可以在任何位置执行命令,例如说它可能会去把你的Cloud Code给删了。
10:27
Speaker A
OK 那 顺便 呢 我们 也 介绍 一下 这里 的 模型 选择 那点 开 之后 我们 可以 选择 速度 快速 呢 就 相当于 加急 通道 会 消耗 我们 更 多 的 额度 那 这里 呢 可以 选择 其他 模型 但是
10:40
Speaker A
开玩笑啊,它一般情况下是不会这样抽风的,AI呢也没有嫉妒情绪。妈,那大家尤其是新手朋友就选择自动审查模式,相信AI就完了,毕竟咱又能审的比AI好多少呢,对吧。
10:56
Speaker A
要 快 很多 的 但是 呢 它 的 转录 速度 远不如 大家 去 下载 一个 语音输入 法 还是 非常 推荐 大家 用 语音输入 的 好 那 现在 我们 通过 一个 本地 文件 处理 的 案例 也 了解 了 codex 上 常用
11:10
Speaker A
OK,那我们选中了刚刚的这个视频的文件夹,继续来提出我们无理的要求,让它帮我们把这个文件夹里的所有视频素材都按它们的实际画面来重新命名。
11:23
Speaker A
操作 那 这些 命令 是 什么 意思 呢 刚刚 的 案例 其实 也 已经 用到 过 了 比如说 它 把 视频 抽针 出来 还 把 几个 视频 拼接 到 一起 它 用到 的 FFMPEG 就是 命令行 工具 还有 一些 我们
11:36
Speaker A
哎,它就开始做了,而且大家看它非常聪明,它先看了看我们到底有多少个视频,然后它选择用抽针的方式抽取关键画面来判断内容是什么。
11:49
Speaker A
我们 授权 的 情况 下 可以 使用 我们 的 终端 来 替 我们 做 这些 事 那 我们 就 来 让 Codex 帮 我们 来 安装 一些 平时 对于 小白 来说 非常复杂 的 东西 吧 第一类 常用 依赖 比如说 什么
12:04
Speaker A
而且它还知道它不要一张一张图去看,它给拼成了缩略图的形式,一组一组地去看。
12:15
Speaker A
挨个 装 那 现在 我们 就 直接 跟 Codex 说 帮 我 安装 个 node . js 给 它 发 过去 也 是因为 这些 东西 呢 其实 都 是 比较 所以 在 我们 的 自动 审核 的 权限 模式 下
12:29
Speaker A
OK,很快啊,这个文件夹里面的文件名就全改变了。过程当中,Codex也是没有向我们提全的,因为它都是在这个文件夹内去操作的。
12:43
Speaker A
Cloud Code 我们 都 可以 让 Codex 帮 我们 装完 了 呢 它 还 能 教 我们 该 怎么 用 那 我们 装 一个 Hermis 吧 我 其实 都 不 需要 给 他 官网 和 仓库 链接 我 就 说
12:54
Speaker A
那我们也可以检查一下,它都对应好了没有。
13:08
Speaker A
还 帮 我们 验证 过 已经 装好 了 你 瞧瞧 那 我们 照着 他 说 的 来 启动 一下 试试 真的 帮 我们 装好 了 那 往后 的 配置 我们 就 不 在 这里 继续 了 但是 大家 应该 get
13:20
Speaker A
OK,钢琴加音乐演奏厅,没错;雪山晋升格斗,没错;旗袍女人夜相卖热饮,哇。
13:32
Speaker A
问 Codex 什么 瞎 死 了 马挂 了 , 升级 出现 了 问题 都 可以 让 Codex 直接 帮 你 修 , 是不是 很 方便 那 第三类 有点 没 那么 必要 , 但 它 其实 也 可以 就是 像 Cursor
13:45
Speaker A
而且它的这个命名还遵循着一个序号、任务、场景、行动的一个清晰的命名格式。AI做事的这个细心程度啊,人类你不服不行。
13:58
Speaker A
现在 Codex 有个 缺点 是 它 没有 办法 打开 我们 的 文件 内容 直接 去 手动 编辑 虽然 这个 侧边 栏 呢 是 可以 看到 一些 文件 结构 和 内容 的 但是 我们 都 没法 编辑 所以 大家 可以 让
14:11
Speaker A
那另外呢,我们其实也可以在同一个项目里面开多个不同的对话,它们的上下文都是不一样的,但是同样都可以随时访问我们这个文件,这个项目。
14:26
Speaker A
我们 来 手动 编辑 那 第四类 就 比较 重要 了 就是 Agent 本身 会 常用 到 的 那些 Skills , MCP 和 CLI 那 Skills 和 MCP 本身 Codex 也 是 支持 的 我们 后面 会 详细 讲到 我 先挑
14:40
Speaker A
比如说我们在另外一条对话,我们又给它一个不同的任务,让它想办法把所有关于风景的视频都剪成一整条。
14:53
Speaker A
官网 地址 比如说 我们 下载 一个 专门 找 skill 的 这个 find skill 而 我 方式 就是 直接 把 链接 拷贝 给 codex 然后 跟 他 说 帮 我 装 一下 这个 skill 在 它 装 的 期间 我们 也
15:06
Speaker A
哎,没想到吧,它真的能剪。它自己想办法用了些工具,问我们要了一些权限,用这个FFMPEG给它拼在了一起。
15:21
Speaker A
一些 积极 AI 化 的 软件 把 几乎 所有 它 在 软件 里 能 做 的 操作 都 做成 了 命令 让 Agent 能够 方便 的 去 操作 我们 把 这个 链接 发 过去 让 它 开始 下载 这边 其实 会
15:35
Speaker A
效果的确是关于风景的都剪成了一条。
15:49
Speaker A
这里 Find Scale 它 是 已经 装好 了 我们 再 看 Facial Cell ular 这边 它会 引导 我们 去 做 一些 授权 我们 就 跟着 它 的 引导 去 完成 就 好 了 OK 那装 好 非书 CLI 那 Codex
16:03
Speaker A
OK,如果我们要创建一个新的任务,我们其实也可以手动在这边创建,它也会自动在我们本地创建一个文件夹。
16:15
Speaker A
用 自然语言 的 方式 让 Codex 帮 我们 装上 了 Hermes , Node 非书 CLI 一大堆 东西 这 就是 Codex 作为 Agent 的 第二 大 常用 能力 命令行 使用 那 这个 能力 和 这个 章节 的 演示 也 是 希望
16:30
Speaker A
然后我们跟Codex对话的整个过程,Agent产生出来的任何文件,PDF什么、Markdown、PPT,它都会直接存在我们本地的电脑上。
16:43
Speaker A
Cloud Code 的 朋友 应该 都 知道 CC 有 一个 手动 的 持久 记忆 Cloud . md 还有 一个 自动 的 记忆系统 都 是 把 我们 希望 Agent 能够 长期 记住 的 比如 规则 偏好 和 我们 的 信息 之类 的
16:57
Speaker A
OK,到这里大家应该get了,Codex可以随时访问我们的本地文件,去读取内容、写文件、删文件、移动文件,文件夹里的内容也就成了我们Codex随时可以获取的上下文。
17:10
Speaker A
记忆系统 在 Codex 里面 呢 手动 的 持久 记忆 文件 叫做 agents . md 而且 它 也 有 一个 自动 的 记忆 机制 来 我们 打开 设置 找到 个性化 那 在 这里 的 这个 自定义 指令 实际上 就是 一个 全局
17:27
Speaker A
那这里的项目也就对应着我们在本地的一个文件夹。
17:41
Speaker A
Codex 说 比如说 我 说 一个 我 希望 你 以后 对 飞书 文档 里 的 任何 修改 都 使用 一个 专属 的 你 的 文字 颜色 和 用 删除 线 的 方式 来 修改 不要 直接 的 修改 然后 这个 帮
17:55
Speaker A
诶,那刚刚这么个任务会花我们多少上下文呢?我们只要看这里就能看到。
18:08
Speaker A
去 遵循 我们 这个 规则 了 比如说 我 这里 已经 有 一篇 Facial 文档 了 我 在 侧面 也 评论 了 几个 我 想 修改 的 地方 我 直接 可以 把 这个 链接 发给 Codex 我 让 他 根据 我 侧面
18:20
Speaker A
那这个小圈代表的是我们现在的这个对话和里面的操作一共使用了GPT-5.5的多少上下文窗口。
18:32
Speaker A
效果 果然 他用 了 紫色 的 字 和 删除 线 的 方式 来 帮 我们 做 的 文档 修改 那 这个 呢 是 全局 的 Agent . md 适合 这些 适用 于 所有 任务 的 一些 大 原则 比如说 我们 的
18:46
Speaker A
如果我们把鼠标悬上去呢,它还会有更详细的一个信息。
18:59
Speaker A
选择 一个 项目 的 对话 然后 打开 编辑器 自己 在 这里 手动 的 创建 一个 Agen tMD 的 文件 然后 我们 去 写 一些 针对 我们 这个 项目 的 一些 规则 当然 也 可以 让 Codex 来 帮 我们 写
19:13
Speaker A
当上下文快满的时候,Codex会自动帮我们压缩上下文,不过其实当我们一个任务告一段落之后,不用等它快满了让它自动压缩,我们也可以自己通过斜杠压缩这个命令来手动去压缩上下文。
19:25
Speaker A
个性化 这个 下面 我们 也 看到 了 我们 需要 手动 打开 这个 自动 记忆 功能 它 的 机制 是 我们 打开 这个 功能 之后 Codex 会 在 我们 结束 对话 或者 是 结束任务 这个 对话 闲置 一段时间 之后 它 帮 我们
19:41
Speaker A
这样呢,可以让模型更聚焦在我们的新任务上,也省一点上下文的额度。
19:53
Speaker A
额度 太低 的 时候 它 也 就 不记 了 并且 这个 自动 记忆 文件 OpenAI 官方 是 不 建议 我们 去 手动 修改 的 顶多 我们 可能 删一 删 有些 没 必要 的 信息 那 这个 文件 大概 是 长 这样
20:05
Speaker A
那当然大家除了这个对话的上下文语量,其实我们还想知道,我作为一个免费用户,或者是我作为一个Pro用户、Plus会员,我还有多少总共的额度可以用,对吧?
20:19
Speaker A
召回 这 段 记忆 那 再 往 下 呢 是 用户 在 这件 事情 上 的 偏好 大概 是 什么样 的 那 第五段 呢 是 一些 可 复用 的 一些 知识 一些 踩 坑 的 记录 那 这些 内容 都
20:29
Speaker A
这个呢有两种方式查看。
20:40
Speaker A
规则 和 要求 我们 还是 通过 组织 Agent State MD 来 实现 那 大家 学完 这些 视频 之后 我 也 想 给 大家 再 做 一期 通过 组织 不同 层级 的 Agent State MD 给 自己 做 一个 非常 懂
20:52
Speaker A
一个呢是左边的设置,这里我们点开剩余额度,就能看到你5小时内还剩下多少,那本周内又还剩下多少,甚至呢也有什么时候到期会刷新的一个提示。
21:06
Speaker A
功能 所以 这一 章节 呢 我们 不 只会用 它 的 图片 生成 我们 会带 大家 做 一个 完整 的 个人主页 的 开发 项目 并且 再 了解 一些 Codex 在 小白 开发 中 的 一些 用法 和 功能 那 我们 再来 开
21:20
Speaker A
这个产品的设计还是比Cloud友好多了。
21:35
Speaker A
我们 确认 之后 它 再 开始 行动计划 模式 呢 比较 适合 我们 的 任务 有 一定 复杂性 或者 我们 自己 也 还 没想 清楚 可以 跟 AI 讨论 出 一个 计划 那 假设 我们 现在 就是 第二种 情况 我们 其实 没
21:48
Speaker A
那另一种方式呢,就是我们可以直接在对话框里输入斜杠,然后找到这个状态。
22:00
Speaker A
大家 可以 按照 自己 的 要求 去 选择 那 我 就 选 这个 个人 品牌 吧 然后 如果说 这些 选项 中 没有 我们 满意 的 呢 我们 也 可以 选到 最后 一个 来 填写 我们 详细 的 要求 比如说 我要 他
22:13
Speaker A
那打开这个状态之后,它的绘画这里就会持续显示我们的上下文余量,这个5小时和一周的限额。
22:27
Speaker A
我们 是否 实施 此 计划 其实 基本 的 计划 我们 看着 没有 什么 问题 但 我们 也 可以 补充 一些 调整 方案 比如说 我们 刚才 就要 说 到 了 要 用 它 的 Image 2 的 生成 能力 我们 这里
22:40
Speaker A
但再次说实话,这个Codex的额度还是非常大方的,20刀的额度,我认为是可以满足大多数白领工作的高频使用的。
22:54
Speaker A
这个 小探 号 的话 还 能 看到 他 说 的 这个 风格 到底 意味着 什么 意思 这个 产品 的 小 细节 真的 是 我 很 喜欢 那 我们 就 选 他 推荐 的 吧 然后 他出 了 一版 新 的 计划
23:06
Speaker A
OK,那顺便呢,我们也介绍一下这里的模型选择。
23:18
Speaker A
哟 它 的 第一张 图 出来 了 不错 挺 有 艺术 感 的 果然 是 最强 的 image2 那 我 要 补充 的 这个 知识点 呢 叫做 引导 如果说 大家 在 codex 执行 一个 很长 的 任务 的 过程 当中 你
23:31
Speaker A
那点开之后,我们可以选择速度,快速呢就相当于加急通道,会消耗我们更多的额度。
23:43
Speaker A
发送 出去 大家 会 看到 它 没有 立刻 打断 我们 的 任务 没有 发出 去 实际上 它 在 这里 排队 呢 那 我们 看到 右边 的 这个 引导 按钮 它 写 着 我们 不 打断 模型 运行 会 在 下次
23:58
Speaker A
那这里呢可以选择其他模型,但是大家都选5.5,因为它确实更好用。
24:11
Speaker A
不会 让 它 重新 再 跑 一轮 任务 那 另外 一个 小 功能 点 我们 找到 一个 已经 结束 的 任务 我们 看 一下 AI 的 回复 每个 AI 回复 的 下面 都 有 一个 这个 按钮 叫做 分叉 Falk
24:25
Speaker A
然后呢,这里可以选择智能程度,其实呢一般中度智能就够了,所以我们选高。
24:39
Speaker A
个 小 功能 宠物 我们 点开 设置 外观 然后 这 下面 就 有 一 小队 小 宠物 可以 选 甚至 呢 我们 还 可以 点击 创建 让 codex 根据 对 我们 的 了解 来 生成 一个 定制 化 宠物 那
24:53
Speaker A
OK,那这个小麦克风呢肯定就是语音输入功能了,比手打字还是要快很多的。
25:07
Speaker A
分钟 之后 网页 完成 了 我们 来 看看 效果 因为 Codex 有 一个 内置 的 预览 浏览器 我们 可以 直接 打开 右边 的 侧边 栏 我们 还给 它 放大 一点 这个 网页 的 效果 确实 是 不错 不过 现在 的
25:22
Speaker A
但是呢,它的转录速度远不如大家去下载一个语音输入法,还是非常推荐大家用语音输入的。
25:37
Speaker A
图片 比如说 我们 要 这个 logo 放大 一点 然后 批注 这里 这 张图 加上 一个 人物 好 把 这个 删掉 然后 对话框 里 就 会 加上 我们 这 几条 批注 然后 我们 点击 发送 它 就 会 针对 我们 的
25:55
Speaker A
好,那现在我们通过一个本地文件处理的案例,也了解了Codex上常用的一些功能。
26:09
Speaker A
的 好 时候 了 因为 我们 也 有 了 一定 的 内容 我们 就让 它 自己 生成 一下 我们 打开 编辑器 看看 不错 项目 的 背景 各种 信息 各种 规则 各种 文件 路径 都 已经 写 好 了 那 以后
26:23
Speaker A
那Codex的第二大能力就是命令行工具使用。
26:36
Speaker A
不 做 精修 了 我们 直接 准备 部署 上线 当然 大家 自己 做 的 时候 完全 可以 去 打磨 的 更好 那 网页 上 的 这些 信息 也 换成 更 真实 信息 就 好 那 我们 现在 要 部署 呢
26:47
Speaker A
其实刚才我们说到权限的时候就有提到,在默认权限下,它可以读写文件,但是却不能执行一些命令,一些联网的操作。
27:02
Speaker A
, MCP , CLI 这 一类 东西 的 一个 完整 集合 包 比如说 操作 邮箱 操作 日历 操作 Github 啥 的 那 我们 来点 开 左边 的 这个 插件 栏 我们 看 这里 呢 已经 默认 帮 我们 打开 了
27:16
Speaker A
那这些命令是什么意思呢?刚刚的案例其实也已经用到了,比如说它把视频抽针出来,还把几个视频拼接到一起,它用到的FFMPEG就是命令行工具。
27:31
Speaker A
列出来 了 大家 课后 可以 按 需装 上点 这个 加号 就 好 了 那 我们 先翻 到 这个 coding 板块 因为 我们 想要 部署 上线 嘛 通过 插件 会 非常 方便 其实 呢 这个 Vers ale 和 Netl ify 都 可以
27:45
Speaker A
还有一些我们熟悉的命令,比如说我们在终端里面来克隆一个GitHub仓库,或者是大家近期比较熟悉的,我们在命令行里面输入一些命令来下载龙虾和各种依赖。
27:58
Speaker A
选上 的 也 记得 要 选上 然后 我们 再 回到 对话 当中 告诉 他们 我们 想 用 这个 Netl ify 把 这个 网站 给 我们 部署 上去 我们 大家 也 不用 管它 咋 部署 的 反正 它 需要 干什么 它 都
28:12
Speaker A
那Codex的第二大能力就是在我们授权的情况下,可以使用我们的终端来替我们做这些事。
28:24
Speaker A
已经 登录 好 了 然后 继续 的 帮 我们 部署 这 就 搞定 了 这个 链接 呢 就是 我们 最后 的 网站 了 只要 把 这个 发出 去 别人 就 能 访问 你 的 个人主页 了 那 如果 大家 想
28:36
Speaker A
那我们就来让Codex帮我们安装一些平时对于小白来说非常复杂的东西吧。
28:50
Speaker A
我们 回到 刚才 我们 已经 装好 的 插件 其实 这里 还有 两个 非常 重要 的 内置 插件 就是 Brow ser Use 和 Comp uter Use 还有 Chrome 浏览器 这些 有 什么 用 呢 Brow ser Use 顾名思义 就是 Codex 可以
29:06
Speaker A
第一类常用依赖,比如说什么Node.js、Git什么的,也都是大家以后使用各种Agent或者是做其他项目必备的一些工具。
29:25
Speaker A
大家 能够 比较 直观 的 看到 它 的 一个 效果 吧 那 这个 鼠标 呢 是 它 自己 在 移动 然后 它 是 自己 看 了 上面 的 答案 在 自己 填写 然后 填完 这 一页 它 也 会 自动 的
29:35
Speaker A
那之前大家要装这些依赖都得去看一个手把手教程,然后照着命令抄,挨个装。
29:48
Speaker A
是 我们 自己 已 登录 的 自己 的 浏览器 它 不会 再 新开 浏览器 那 我们 如果 把 它 给 勾 选上 之后 它会 引导 我们 去 Chrome 里面 装 一个 插件 那装 好 之后 呢 它 就 可以 操作
30:00
Speaker A
那现在我们就直接跟Codex说帮我安装个Node.js,给它发过去。
30:12
Speaker A
我们 该用 浏览器 干 别的 我们 可以 接着 干 OK 那 Comp uter Use 就 更 厉害 了 它 不 只 能够 操控 浏览器 连 你 电脑 上 的 这些 APP 它 都 可以 操作 只不过 呢 暂时 只有 Mac
30:24
Speaker A
也是因为这些东西呢,其实都是比较常见的,所以在我们的自动审核的权限模式下,你看它基本上都不问我们要提权,就熟门熟路地帮我们装好了。
30:38
Speaker A
最火 的 歌 然后 用 我 的 微信 给 QQ 发条 微信 说 请 收下 我 一个点 赞 收藏 关注 等 了 吧 OK 它 陷入 了 思考 然后 它 看到 我们 的 应用 都 正在 运行 中 并且 向
30:54
Speaker A
那第二类就是那些爆火的,但是有上手门槛的一些新的Agent,比如说龙虾、Hermes,甚至还有这个Codex的竞品Cloud Code,我们都可以让Codex帮我们装完了。
31:11
Speaker A
给 它 允许 一下 OK 看 它 这个 小 鼠标 它 正在 犹豫 着 准备 搜索 点击 好 朋友 们 失败 了 因为 我 上次 都 成功 了 但是 我 估计 现在 微信 已经 开始 严防 这种 agent 的 操作
31:25
Speaker A
呢,它还能教我们该怎么用。
31:37
Speaker A
懂 了 吧 就是 它 可以 操作 浏览器 并且 可以 操作 我们 的 电脑 当然 实际上 我 觉得 它 的 操作 效率 目前 来说 还是 稍微 有点 低 的 我 不 太 喜欢 用 这 两个 强大 的 功能 不过
31:50
Speaker A
那我们装一个Hermes吧,我其实都不需要给它官网和仓库链接,我就说最近有一个叫Hermes的Agent很火,你帮我安装一个吧。
32:01
Speaker A
呢 是 我们 人为 沉淀 的 一些 可 复用 的 方法 流程 和 工具 的 组合 相当于 给 agent 做 某些 具体任务 的 一些 行动指南 那 因为 之前 我们 已经 让 这个 Codex 帮 我们 装 过 一个 叫做 Find
32:16
Speaker A
它就会自己去搜索,然后帮我们判断到底是哪一个。
32:29
Speaker A
那个 前端 设计 的 Skill 还有 一个 去 AI 位 的 那 我们 这 两个 都 发给 它 等 会 都 会 刚好 有用 很快 他 就 把 我们 装好 了 那 以后 大家 想要 下载 skill 如果说 遇到 这个
32:43
Speaker A
然后呢,它根据官方的文档帮我们陆续装好了,还帮我们验证过已经装好了。
32:54
Speaker A
自己 工作 的 专属 skill 创建 skill 也 有 两种 方式 第一 就是 直接 告诉 Codex 你 想要 创建 一个 什么样 的 skill 通过 跟 他 讨论 打磨 得 出来 一个 skill 那 另 一种 呢 就是 我们 接下来 要 演示
33:08
Speaker A
你瞧瞧,那我们照着他说的来启动一下试试,真的帮我们装好了。
33:22
Speaker A
那 我们 就 得 先 通过 一步步 的 引导 codex 让 它 真正 实现 一个 我们 满意 的 文章 来 我们 新开 一个 对话 正好 我们 刚才 不是 装过 Github 插件 吗 我们 可以 直接 先问 他 最新 的 Github
33:37
Speaker A
那往后的配置我们就不在这里继续了,但是大家应该get了,有了Codex以后,那些复杂的要收你599的部署,你都可以直接让Codex帮你做了,怒省599。
33:52
Speaker A
我们 写 一篇 本周 Github 热门 项目 推荐 这样 的 一篇 文章 好 那 它 写 好 了 这 一篇 之后 我 觉得 稍微 有点 太 人机 了 我 希望 可以 更 口语化 一点 并且 我 只 想要 5 个
34:05
Speaker A
而且我们在使用的过程中遇到任何问题,还可以截图去问Codex,什么瞎死了、马挂了,升级出现了问题,都可以让Codex直接帮你修,是不是很方便?
34:17
Speaker A
它 的 结果 稍微 优化 了 一点 但是 我们 还 希望 加 一个 我们 固定 的 开头 我们 的 结尾 并且 还要 让 它 用 上 Image 2 来 帮 我们 生成 一些 配图 最后 呢 我 还 希望 它
34:30
Speaker A
那第三类有点没那么必要,但它其实也可以,就是像Cursor、Antiquarity这种软件应用,平时都是我们去手动在网页上下载的,它也可以帮你下载和卸载。
34:44
Speaker A
差不多 满意 并且 我 还给 它 最后 加 了 一步 要 让 它 把 这个 飞 书 文档 发送到 指定 的 群里 让 大家 都 来 看看 最终 它 的 效果 是 这样 的 果然 发出 去 了 其实 如果 想
34:57
Speaker A
那大家用Codex,我其实也建议大家去下载一个Agent IDE,因为现在Codex有个缺点是它没有办法打开我们的文件内容直接去手动编辑。
35:11
Speaker A
这 一整套 的 标准 和 动作 做成 一个 skill 搞定 了 我们 再 输入 斜杠 再往 下 找 我们 就 发现 就 有 了 这个 skill 我们 可以 直接 这样 手动 的 调用 这个 Skill 也 可以 直接 说 生成
35:26
Speaker A
虽然这个侧边栏呢是可以看到一些文件结构和内容的,但是我们都没法编辑。
35:39
Speaker A
写出 差不多 的 文章 所以 我们 就 不是 了 但是 大家 都 理解 了 吧 Skills 呢 可以 把 我们 经过 验证 调 好 一次 的 一整套 流程 和 方法 给 它 固定 下来 下次 做 这件 事情 Codex 就 可以
35:52
Speaker A
所以大家可以让Codex下载一个自己喜欢的,比如说我们就这样下载。
36:08
Speaker A
这个 肯定 是 有点 不太 知道 怎么 填 的 所以 跟 我们 之前 说 的 一样 我们 最好 的 方式 还是 把 你 想 装 的 那个 Skill 的 链接 拷贝 给 Codex 让 它 自己 装 就 完 了
36:19
Speaker A
那下好之后呢,我们再执行一个Git init一个初始化。
36:33
Speaker A
问 一下 他 哎 那 这样 呢 Codex 也 就 可以 直接 获取 我们 Note book LM 上面 的 这些 外挂 知识库 了 OK 最后 一个 Codex 能力 是 自动化 定时 任务 其实 定时 任务 本身 并 不 稀奇 比如
36:49
Speaker A
那右上角就会出现这个东西,随时可以把我们的项目在编辑器中打开,我们来手动编辑。
37:01
Speaker A
一整套 组合 起来 的 任务 让 Agent 定点 执行 自动化 加上 智能化 和 定制 化 方显 美妙 比如说 刚才 我们 做 的 这个 热门 项目 图文 的 这个 skill 我们 就 可以 把 它 设成 每 三天 或者 是 每周 让
37:16
Speaker A
那第四类就比较重要了,就是Agent本身会常用到的那些Skills、MCP和CLI。
37:29
Speaker A
自动化 面板 那 它 这里 呢 有 一些 官方 的 参考 事例 了 不过 大多数 是 跟 开发 相关 那 我们 选择 新建 一个 自动化 其实 你 看 要 填写 的 东西 非常简单 其实 就是 用 提示 词写 好 这些
37:43
Speaker A
那Skills和MCP本身Codex也是支持的,我们后面会详细讲到,我先挑两个大家安装一下,方便我们后面综合起来做案例。
37:57
Speaker A
我 也 还是 倾向 于 让 大家 用 第二种 更 简单 的 方式 就是 直接 在 对话 里 跟 Codex 说 那 我们 直接 跟 他 说 帮 我 创建 一个 自动化 任务 每周 一 早上 9 点 自动化 执行
38:09
Speaker A
那这些Skill和CLI呢,通常来讲不像那些Git那种大项目那么著名,所以我们最好是找到它的具体仓库或者是明确的官网地址。
38:22
Speaker A
的 这个 邮箱 插件 Github 飞书 都 已经 连上 了 Codex 那么 你 也 可以 让 它 每天 下午 6 点帮 我 汇总 日历 上 完成 的 会议 Github 上面 的 提交 记录 和 我 的 邮箱 回复 记录 生成
38:36
Speaker A
比如说我们下载一个专门找Skill的这个Find Skill。
38:53
Speaker A
它 就 会 提示 你 允许 这台 手机 控制 你 的 电脑 直接 就 搞定 了 如果 你 有 多台 电脑 的话 也 可以 给 它 分别 连上 这 就 等于 你 不管 在 大街 上 地铁 上 还是 朋友
39:05
Speaker A
而我方式就是直接把链接拷贝给Codex,然后跟它说帮我装一下这个Skill。
39:19
Speaker A
主要 能 连 的 是 Mac 系统 的 Codex 好 那 到 这里 Codex 的 所有 核心 能力 我们 就 全部 过 完 了 来 我们 回顾 一下 Codex 可以 操作 我们 的 本地 文件 可以 使用 我们 电脑 上
39:32
Speaker A
在它装的期间,我们也说一下Codex的另一大好处,并行任务处理。
39:46
Speaker A
和 电脑 还 可以 把 知识 和 流程 沉淀 成可 复用 的 Skill 技能 它 可以 使用 MCP 连接 外部 它 还 可以 设置 自动化 的 定时 任务 不过 其实 比起 这些 功能 本身 我 也 希望 大家 记住 两件事
40:01
Speaker A
我们完全可以在它做这个事情的时候,再开一个对话让它去下载一个别的。
40:15
Speaker A
一下 然后 得到 答案 我们 就 走 了 现在 使用 Codex 这类 的 Agent 每个 人 都 得 像 领导 一样 帮 他 准备 他 所 需要 的 上下文 和 工作 环境 给 他 指明 一些 任务 目标 然后 来
40:28
Speaker A
我们下载一个Facial CLI其实非常典型,因为现在有一些积极AI化的软件,把几乎所有它在软件里能做的操作都做成了命令,让Agent能够方便地去操作。
40:43
Speaker A
了 恭喜 大家 今天 都 升职 了 记得 点赞 收藏 关注 我们 下次 见 了
Topics:CodexCloud CodeAI Agent本地文件操作视频剪辑自动命名权限管理命令行工具记忆系统零基础教程

Frequently Asked Questions

Codex和Cloud Code有什么区别?

Codex主要支持OpenAI GPT模型,操作更友好,适合零基础用户;Cloud Code功能更齐全,支持Anthropic和OpenAI模型,更适合专业开发者。

Codex如何管理本地文件权限?

Codex有三种权限模式:默认权限限制在当前文件夹,自动审查模式智能判断操作风险,完全访问权限允许对电脑几乎所有文件操作。

使用Codex需要准备什么?

只需一个ChatGPT账号(免费账号也可),安装Codex后登录即可开始使用,后续设置和权限可根据需求调整。

Get More with the Söz AI App

Transcribe recordings, audio files, and YouTube videos — with AI summaries, speaker detection, and unlimited transcriptions.

Or transcribe another YouTube video here →