V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  TimePPT  ›  全部回复第 2 页 / 共 130 页
回复总数  2595
1  2  3  4  5  6  7  8  9  10 ... 130  
御三家官方指南:
https://platform.openai.com/docs/guides/prompt-engineering
https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview
https://ai.google.dev/gemini-api/docs/prompting-intro
配合各家的 cookbook (就不放链接了,官方站点都有),基本搞定常见九成 Prompt 撰写

PE 的常见概念科普:
https://www.promptingguide.ai/zh

OpenAI o1 / DeepSeek R1 这类推理模型,Prompt 撰写和之前的 LLM 略有不同,感兴趣看这篇
https://www.latent.space/p/o1-skill-issue

以上看完,比市面上一堆所谓 Prompt 技巧管用的多
15 天前
回复了 mingtdlb 创建的主题 Local LLM LLM 私有化部署
模型的私有化部署一直有。

前 GPT 时代,模型参数都没那么大( BERT 这种),基本上企业自部署的比较多。
GPT 时代,一般私有化部署的都是 100B 参数以下的模型。
一般本地台式机 or 笔记本的本地部署,参数量级在几十 B 以下( 10B 以下极轻量级最常见),适当做些量化处理,基本上都能跑。

现在营销号推的 DeepSeek 本地部署的,绝大部分其实指的是蒸馏过的小模型。
同道中人,大枣泡水一直最爱!
- 前一天好好休息
- 有耐心
- 有分歧听老婆的
19 天前
回复了 subtleworks 创建的主题 JavaScript ChatGPT 语音对话技术
OpenAI 自家 API ,支持 WebRTC 的
北京的联通单宽带之前办过,总体就比较不划算。

可以试试找个熟人朋友,有富余的套餐里的宽带(比如移动月套餐满多少送一根宽带这种),转租一下,还能帮人分担点成本。
也可以找营业厅小姐姐,看有没有套餐拆包卖的——这个其实违规,但好多营业员都这么干的。
20 天前
回复了 teli 创建的主题 问与答 互联网服务产品如何直播带货?
看看百度网盘,WPS 怎么在抖音卖会员的
20 天前
回复了 Hawthorne 创建的主题 macOS 大家都用哪个键唤醒系统?
@Hawthorne 我一直没有哎,屏保状态 or 息屏时候,直接回车就进输入密码状态了,然后就按下电源键/TouchID 直接进了
不过想想其实直接 TouchID 最省事,哈哈
20 天前
回复了 Hawthorne 创建的主题 macOS 大家都用哪个键唤醒系统?
万年回车
有研究表明,预训练时使用多语言语料是有助于智能提升,且多语言在底层是 Align 的。
@las917vki 其实还好。
我一直官网买美区卡。十年下来花了几千刀了,一直没问题。
24 天前
回复了 8eacekeep 创建的主题 问与答 新年快乐!大家会进行赛博大扫除吗?
平日里随时整理,所以没这计划😂
出来第一天就试了下,Agent 能力不如 cursor ,tab 补全有些拉。
胜在白嫖。其他我感觉没啥优势。
期望各家都卷起来,对普通用户是好的哈哈
31 天前
回复了 lurui45 创建的主题 机器学习 大模型能记住所有它训练过的数据吗?
你可以简单理解为,模型的训练阶段,通过学习极大量语料,获得了词元( token )间的前后脚出现的概率。

等推理阶段,通过获取上文所有词元组成的 context ,输出最有可能的下一个词。

所以,理论上,如果红楼梦作为了语料进入训练。在 context 足够明确的情况下,让补全红楼梦,是可以做到的。但因为预测的是下一个 token ,那么下一句是否正确,也取决于其他训练语料。甚至还有其他影响,就不多展开了。

如果感兴趣,还是建议找点机器学习、深度学习的科普资料读一下。
31 天前
回复了 oktp123 创建的主题 推广 教程:如何从 OpenAI 平滑迁移到 DeepSeek
@Livid 推广
32 天前
回复了 felix9ia 创建的主题 Web Dev 应不应该把主键 id 暴露在 url 上?
@chendy 完全同意,其实主要问题就是推断业务增长情况,和遍历爬虫(一个冷知识:QQ 邮箱的数字 @qq.com 也有类似问题所以一开始入信反垃圾策略就很严格),其他没啥大问题。

我新项目一般数据库用 PostgreSQL ,唯一 id 使用 uuidv7 ,传给前端 url 外显时候使用 url safe 的 base64 显示了,除了丑点没啥其他副作用。
这个实用,感谢!
不用想了,你这需求是事实性信息查询,且有一定实效性(地名、地址、电话都会随着时间变化),没有外部算法工程约束的情况下,大模型幻觉是不可避免的。最好就是结合外部权威信息作为 context ,让模型去做整理( Long context input or RAG )
1  2  3  4  5  6  7  8  9  10 ... 130  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2517 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 42ms · UTC 15:38 · PVG 23:38 · LAX 07:38 · JFK 10:38
Developed with CodeLauncher
♥ Do have faith in what you're doing.