No menu items!

    不写代码、靠“玩”年入百万,提示工程师正成硅谷新宠

    一个阳光明媚的早晨,住在旧金山的软件工程师 Anna 像往常一样,坐在电脑前,打开 ChatGPT,输入 ” 帮我规划我的一天”。

    ChatGPT 回答 ” 当然可以!”,随机给出从早上到晚上的日程计划,并提示 ” 你可以根据自己的情况进行调整。”

    Anna 想了想,在对话框里补充,” 我晚上 9 点要哄娃睡觉,重新帮我规划。”

    这一次,ChatGPT 的帮她在晚上的日程里添加了 ” 帮助孩子准备第二天上学准备物品 ” 和 ” 帮助孩子洗漱并睡觉 “等事项。

    随着 ChatGPT 等 AI 工具的风靡,Anna 身边越来越多的人开始将其作为日常生活和工作的助手。事实上,Anna不仅会向 ChatGPT 咨询生活安排,也会让它处理一些简单的工作,比如给一段代码添加一个功能等。

    不过,当涉及到比较复杂的任务时,即便知道 ChatGPT 很强大,Anna 也觉得有点力不从心,”说了一堆要求,但是它给出的代码经常不是我想要的。”

    Anna 的这句话道出了目前困扰不少科技公司的一个问题:在强大的工具面前,如何更好的与它对话,来完成专业任务?

    对此,一个新兴职业——提示工程师(Prompt Engineer)应运而生。不少公司对这一职位求贤若渴,开出的薪资甚至高达33.5 万美元一年。

    提示工程师的主要职责是帮助训练大型语言模型 ( LLM ) ,让 AI能更好的理解需求,完成专业任务。简而言之,他们的任务就是将一个复杂的任务拆分,提炼成长度有限的自然语言,来一步步查询 AI工具,从而获得更准确的回答。

    用自然语言对话,这听起来是一件再日常不过的事情,可它为什么一下子成为了香饽饽?

    重启对话:逻辑让 AI 更懂需求

    在旧金山,AI 研究公司 Anthropic 为提示工程师开出的薪水高达 33.5 万美元。在职位描述中,该公司提到,”这是编程、指导和教学的结合 “,主要职责是帮助公司构建提示库,让 LLM 完成不同的任务。

    那么,到底什么是提示?提示工程又是什么?

    按照学者们的定义,提示是一组输入文本或指令,用于指导 ChatGPT 等 AI模型生成所需的输出。换句话说,提示是一种特定文本,它的目标是让 AI 模型产出符合特定标准或参数的结果。

    提示工程则是是创建和完善这些提示,以生成所需结果的过程。提示工程的目标是创建准确有效的提示。提示工程师使用自然语言,并将纯文本命令发送到AI 模型,让其执行实际工作。相比之下,传统程序员则使用编程语言,通常需要更多的代码编写和技术知识,以执行相同的任务。

    而提示工程师的薪资如此之高,很大程度上是因为语言模型的成功取决于编写清晰的提示。这需要工程师们开发复杂的策略,将简单的输入转化为高质量的结果,避免出现离题或者不一致的输出。

    目前最出名的提示工程师可能是名为 Riley Goodside 的程序员,就是他发现,只要提示 ChatGPT” 忽略之前的指示”,ChatGPT 就会说出自己从 OpenAI 那里获取的 ” 出厂设置 ” 信息。

    图源:Twitter

    不仅如此,他还凭借出色的提示技术,把 ChatGPT 玩出了不少花样,并在 Twitter上一炮而红。随后,他高薪加入了创业公司 Scale AI,成为了 ” 世界上第一个被招聘的提示工程师 “。

    在 Scale AI 看来,AI 大模型可以被视为一种新型计算机,而 ” 提示工程师 “则相当于其编程人员。通过提示工程找到最合适的提示词,可以激发 AI 大模型的最大潜力。所以,Riley Goodside完全配得上这份薪水。

    不止 Riley Goodside,还有越来越多的人正在加入这个行业。

    29 岁的 Albert Phelps 是 AI 金融咨询公司 Mudano 的一位提示工程师。他和同事们的日常就是为OpenAI 等工具编写提示。这些提示可以作为预设,保存在 OpenAI 的 Playground 中,供其客户使用。Phelps介绍,他们每天需要编写 5 个不同的提示,与 ChatGPT 进行大约 50 次交互。

    和大多数程序员不一样的是,Phelps并没有计算机相关背景,而是毕业于历史系。事实上,对于提示工程师而言,最重要的是逻辑。虽然编程知识和机器学习的背景对工作很有帮助,但却并不是必要条件。

    Anthropic 的技术人员 Matt Bell 就曾提到,”我们最好的提示工程师是一位哲学家。好的提示包括写出极其清晰的解释,并找出造成误解的原因以及如何避免误解。”

    也就是说,当 AI 模型的使用者像软件工程师 Anna 一样,一次性 ” 说了一堆要求 ” 时,可能会因为提示不清晰,而导致AI 误解,给出离题的答案。

    对此,阿德莱德大学澳大利亚机器学习研究所 ( AIML ) 的高级讲师 Lingqiao Liu指出,好的提示工程的关键是将一项复杂的任务分解成一组简单的任务。

    他介绍,如果你问这些模型一个简单的问题(称为 ” 零样本提示 “),它通常会以缺乏细节或结构的 ” 普通 “答案作为回应。为了让 AI 模型给出更加符合标准的结果,用户可以采取以下几种方式:

    第一种方法是一次性提示,即用户给出一对问答示例,让 AI了解需求,并按照该模版处理后续请求。比如,在咨询关于某一种动物的信息时,让模型根据特点、居住区域、饮食习惯等来给出信息。

    第二种是角色提示,例如告诉模型 ” 我是一个妈妈,想要知道每天行程规划 “,从而让模型根据 ” 妈妈 “的角色来给出具体安排。

    第三种方法是引入关键代理。例如,你可以让 ChatGPT 写一个关于机器人的故事,然后让它根据自己的建议进行批评和改写。

    最后一种方法是思维链,即先让 AI 对回答某个问题给出具体步骤,然后在鼓励它依照自己给出的步骤,来推理更复杂的问题。

    如果一位艺术家想要使用 ChatGPT 和 Midjourney 来进行创作,或许可以尝试一下这一条来自 PromptHero的高赞提示:

    [ 我想让你充当 Midjourney 人工智能程序的提示生成器。你的工作是提供详细的、有创意的描述,以激发 AI独特而有趣的图像。请记住,AI能够理解多种语言并能解释抽象概念,因此请尽可能发挥想象力和描述性。例如,您可以描述未来城市的场景,或者充满奇怪生物的超现实景观。您的描述越详细、越富有想象力,生成的图像就会越有趣。这是你的第一个提示:”一望无际的野花田,每一个都有不同的颜色和形状。在远处,一棵巨大的树耸立在风景之上,它的树枝像触手一样伸向天空 ” ]

    总之,对于生成文本的 AI 模型而言,如何编写出逻辑清晰的提示至关重要。不过,在其他领域,好的提示可能需要更多元素。

    构建图像:关键词拓展想象力

    随着提示工程的价值被挖掘,这股新鲜血液开始涌向更多场景。图像则是其中最受关注的领域之一。

    就图像生成而言,创造者们认为提示的好坏与否取决于关键词。

    七个月前,Jason Allen 凭借着下面这张在 Midjourney上创作的一幅作品《太空歌剧院》赢得科罗拉多州的一场艺术比赛。

    Jason Allen 获奖作品 《太空歌剧院》

    为了这幅作品,他耗时约 80 小时,在 Midjourney中测试不同的美学元素,给出不同的主题提示,才呈现出自己想要的图像。

    ” 我想创造一个电影场景,就像你在电影中看到的那样,” 他说,”所以我上网查找了所有与电影摄影相关的关键词。基本上就是是在学习成为一名电影摄影师。”

    通常,AI 模型会从互联网上抓取大量图像及其相关文本进行训练。例如,它可能会对一幅婚纱照打上 ” 新娘 “、” 婚纱 “、”捧花 “、” 微笑 ” 等不同标签,并标记上不同的权重。每个标签会给 AI 模型相应提示,产生可预测的美感。

    “AI艺术的关键在于知道正确的词。就像工程师将设计转化为数学图形一样,它将图像的离散美学元素,比如光线追踪、边缘照明等,转化为模型的特殊语言”,和 Jason 一样通过 AI 来进行创作的另一位艺术家 JHawkk 提到。

    JHawkk 制作的图像

    JHawkk 在 Stable Diffusion 中制作了上面这张图,其提示包括 ” 模拟风格 “、” 佳能 EF 50mmf/1.8 STM 镜头 ” 等 15 个短语,以及 ” 恶心 ” 等他不希望出现在图像中的 31 个负面词汇。

    ” 有时你看到一幅图像,可以将他分解成更小的短语,本质上,这是你描述图像的方式,并且是实际模型本身可以理解的方式。”他说。

    JHawkk 居住在美国中西部,他平时喜欢在 PromptHero 上分享自己的作品和相应的提示。

    PromptHero 是去年 9 月成立的在线社区,目前拥有 15 万名用户,其中 活跃用户就超过 1万名。在这里,用户可以找到直接在 ChatGPT、Midjourney 等 AI 模型和平台中使用的提示。

    ” 我发现了这个问题,当你第一次用它完成某件事时,你的第一次尝试是非常糟糕的,”PromptHero 联合创始人 JavierRamirez 说,” 你需要以正确的方式提示以获得高质量的输出。”

    无论是文本还是图像,如何给出正确提示是一个需要反复试验的过程,正因如此,在过去半年,才会有大量类似 PromptHero 和PromptBase 等提示交流和买卖平台涌现——他们将验证过的提示直接摆在用户面前。

    想做一张可爱考拉的图片?下面这则提示或许可以直接拿走。

    <

    p style=”text-align:center;”>

    觉得英语不过关?下面这则提示或许能让 ChatGPT 成为你最好的英语老师。

    热闹背后的担忧

    不管是科技公司开出的高薪,还是提示交流平台的流行,它们无一不在揭示提示工程是一个被多么看好的领域。

    不过,这样的热度也引起了不少争议。

    首先,AI 通过提示创作的作品,版权归谁?

    目前,通过提示工程生成的作品与大多数版权法的解释相冲突。在美国,当 Jason Allen对获奖作品《太空歌剧院》申请版权时,版权局拒绝了他的申请,称 ” 它不包含任何人类作者身份 “。

    其次,提示工程师的高薪值得吗?

    ” 这可能是泡沫的迹象,” 为亚马逊 Alexa 开发语音控制功能的对话设计工作室 labworks.io 的创始人 TomHewitson 说, ” 最适合做这件事的人是熟悉 AI 的产品设计师或业务分析师,他们的年收入往往在 10 万到 15万英镑之间。”

    最后,提示工程师的职位会存在多久?

    不少人认为,提示工程只会成为一种技能,并不需要一个专门的职位。随着 AI工具在理解人类查询方面变得越来越好,这个职位会变得越来越过时。

    沃顿商学院教授 Ethan Mollick 在 2 月份发推文说:”我强烈怀疑‘提示工程’从长远来看不会有什么大不了的,提示工程师也不是未来会存在的工作。”

    剑桥大学机器学习研究主任 Adrian Weller 认为,虽然能够通过提示与 AI 交互 ” 具有很高的价值 “,但 “我不确定它是否会继续下去很长一段时间。不要过多关注提示工程的当前。它会很快发展的。”

    尽管提示工程师的职业当前备受瞩目,但它到底能够走多远,恐怕只有时间才能解答了。

    热点

    发表评论