V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Int100
V2EX  ›  程序员

请问一下大伙儿, 现在“最快的” DeepSeek API 是哪家?

  •  3
     
  •   Int100 · 15 天前 · 10938 次点击

    请问一下大伙儿, 现在“最快的” DeepSeek API 是哪家?

    • 只讨论满血版 671B, 阉割版不在讨论范围内.
    • 需要稳定的, 官网 API 已经连续 9 天 Major/Partial Outage 了.
    • 硅基流动就别说了, 慢的受不了.🤦
    69 条回复    2025-02-20 02:19:53 +08:00
    amlee
        1
    amlee  
       15 天前   ❤️ 1
    together 的快,但是贵,输入输出都是 7 刀/m
    pig198x
        2
    pig198x  
       15 天前   ❤️ 1
    https://fireworks.ai/ 现在用的是这家,速度还可以。groq 上有个 deepseek r1 蒸馏的 llama3 70b ,速度暴快。
    Int100
        3
    Int100  
    OP
       15 天前
    @amlee 谢谢, together 速度确实比硅基快多了. (钱包已捐 hh)

    @pig198x 感谢, 这就去试试.
    groq 上那个确实超快(纯粹的追求速度😂), 可惜蒸馏的 70B 效果比完整版还是差了一些.
    Charon2050
        4
    Charon2050  
       14 天前
    字节火山有满血版的,送 500,000 tokens ,兼容 OpenAI SDK ,响应快,但是有时候会抽风变成非推理模型
    qianyeyixi
        5
    qianyeyixi  
       14 天前
    直接用官方付费的吧 不贵 百万才 14
    lujiaosama
        6
    lujiaosama  
       14 天前
    @qianyeyixi 打不开 API 平台, 一直处于不可用的状态
    qianyeyixi
        7
    qianyeyixi  
       14 天前
    @lujiaosama 我的 api 还能调通
    INCerry
        8
    INCerry  
       14 天前
    我用的 azure 部署的 r1 ,速度挺快的,就是在美区
    Int100
        9
    Int100  
    OP
       14 天前
    @qianyeyixi 官方 api 在用着, 但是抽风时段太长了, 经常干活的时候用不了😂(被迫寻找替代
    JensenQian
        10
    JensenQian  
       14 天前
    黄老板的免费的 5000 速度还行
    viktor123
        11
    viktor123  
       14 天前   ❤️ 3
    我在用这个 https://ppinfra.com ,在国内几个平台中算比较稳定的了。
    iLoveSS
        12
    iLoveSS  
       13 天前
    @Int100 groq 上那个 70B 不好用吗? DS 原版的 R1 是什么尺寸的模型呀?
    Int100
        13
    Int100  
    OP
       13 天前 via iPhone
    @iLoveSS 完整版 671B ,差了将近十倍参数。
    Alan3
        14
    Alan3  
       13 天前
    请问是平台 api 便宜还是自己在云平台部署划算? 比如楼上的推荐的平台:
    大语言模型名称 上下文 Input Output
    deepseek/deepseek-r1 64000 ¥ 4 /百万 tokens ¥ 16 /百万 tokens
    iLoveSS
        15
    iLoveSS  
       13 天前
    @Int100 哦,那目前国内其他平台提供的也是完整版的 R1 吗? 好像没看到他们提及到该参数.
    Int100
        16
    Int100  
    OP
       11 天前
    @Alan3 api 便宜又方便

    @iLoveSS 这要看平台的描述以及信用了. 目前用的是 Azure 的 API, 国内好像可以直接访问, token 生成速度很快.
    together 的 api 有点奇怪, 一些问题的回答明显和 deepseek 官方以及 azure api 的不同, 甚至答错. 也许是用了过于激进的缓存技术? 已弃用.
    bigbigeggs
        17
    bigbigeggs  
       10 天前
    请教下 op ,我理解 deepseek 不是应该是只有 deepseek app 官网才可以使用么,就算用了 deepseek api ,那也是套一个壳,本质底层还是 deepseek 的服务器。
    bigbigeggs
        18
    bigbigeggs  
       10 天前
    @bigbigeggs 像楼上所说的 together firework 是 deepseek 是什么关系?难道是部署了 deepseek 的一些开源模型,然后使用 together 的 api 请求的是 together 的底层服务器,但是 together 的服务器部署的是 deepseek 开源的模型么?
    Int100
        19
    Int100  
    OP
       10 天前 via iPhone   ❤️ 1
    @bigbigeggs 你使用的是 deepseek 模型比如 R1 ,模型部署后通过 api 接口调用,官网只是给用户提供了一个 web 界面。
    由于模型开源,其他商家如果部署后,同样可以提供 api 服务,选择相应模型即可。
    chy5301
        20
    chy5301  
       9 天前
    有没有速度比较快的 deepseek v3 的 API 😂
    chy5301
        21
    chy5301  
       9 天前
    @viktor123 试了一下效果不错,感谢
    bigbigeggs
        22
    bigbigeggs  
       9 天前
    @Int100 感谢,由于 R1/V3 模型开源,所以 together 、fireworks 这种才能提供 deepseek 的模型,如果不开源也就是提供不了了,是这么意思吧
    bigbigeggs
        23
    bigbigeggs  
       9 天前
    那么我如果有一个很强的机器,我也是可以部署复现 R1 这种模型的对吧
    NeedforV2
        24
    NeedforV2  
       9 天前
    硅基流动的也还可以: https://siliconflow.cn/zh-cn/
    tycholiu
        25
    tycholiu  
       9 天前
    @Alan3 满血版自己部署有一定挑战,也需要 GPU 。用云吧,目前好多家都在打折,亏本卖
    tycholiu
        26
    tycholiu  
       9 天前
    https://ppinfra.com 这个不错,是国内首个支持 DS 的云厂商
    jianyang
        27
    jianyang  
       9 天前
    为什么三方搭建的 DeepSeek 模型让它介绍一下自己都回复说自己是 ChatGPT ,而官网版本回复是 DeepSeek
    dong706
        28
    dong706  
       9 天前
    @NeedforV2 硅基流动的 api 完全不行啊.......测试了大半天,单词调用返回时间到 10 秒-100 秒之间,均值大概在 30 秒。这样的 api 确定能用?
    sayhello2world
        29
    sayhello2world  
       9 天前 via iPhone
    你们的 deepseek api 都是在哪个 APP 上调用? ios 上有好的 app 吗
    Int100
        30
    Int100  
    OP
       9 天前 via iPhone
    @sayhello2world 用的 openwebui 自建的网页做前端
    zololiu
        31
    zololiu  
       9 天前
    @jianyang
    偶尔会有幻觉,说自己是 ChatGPT ,不过自己本地搭建的 DeepSeek 好像就没有这类幻觉。
    jianyang
        32
    jianyang  
       8 天前
    @zololiu R1 模型好一些、V3 模型都是回复自己是 ChatGPT 、官方版本最早也是这个问题不久就修复了、不知道这些三方搭建的是旧模型还是与实际模型不符、实则是小模型
    gggalen
        33
    gggalen  
       8 天前
    @INCerry 大佬为什么我 azure 部署的 r1 很快就 429 超限制呢,好像配置不了每分钟的 token 限制,你可以的吗?
    spritecn
        34
    spritecn  
       7 天前
    阿里,阿里,阿里!!!
    spritecn
        35
    spritecn  
       7 天前
    @tycholiu 这个试了,可以,但昨天阿里上了之后换了阿里,阿里吐字快多了
    chenbin36255
        36
    chenbin36255  
       7 天前
    poe cursor 最快
    a1lenyang
        37
    a1lenyang  
       7 天前
    @pig198x 这个好快,后续使用是会收费吗
    ggbbddjm
        38
    ggbbddjm  
       7 天前
    派欧算力云!! 吹爆!! 5000 万 Token 赠送使用量,我们个人用户差不多可以用一年~我的推荐码 [LF0W2T ] 哈哈哈哈
    ggbbddjm
        39
    ggbbddjm  
       7 天前
    @sayhello2world 我调用的是 派欧算力云的,目前感觉还比较稳定,挺快的
    chenluo0429
        40
    chenluo0429  
       7 天前 via Android   ❤️ 4
    个人目前体验了官方,硅基流动,字节火山和阿里百炼。目前主用字节的 deepseek 加阿里的 qwen 。

    官方的无疑质量最差,api 毫无人权。

    硅基流动的 R1 体验上我感觉是最快的,前提是用 Pro ,就是不能用赠币的那个。字节稍慢一点,不过差距特别明显,阿里的明显比前两者更慢一些。
    但是硅基流动有个问题,就是 R1 输出过长会中断,思考到五六千 token 就直接停了,所以被我弃用了。

    字节的 V3 最快,几乎是其他服务的速度的 1.5 到 2 倍,他要不是写了满血,我都以为的蒸馏的 70B 了。硅基流动略好于阿里。但是字节的 V3 不支持 function call 。

    阿里的 qwen 也都还不错,速度也还行。

    硅基流动还有个问题,tpm 给的很低,只有 10000 ,多人使用容易达到上限,其他两个就给的很多。
    INCerry
        41
    INCerry  
       7 天前
    @gggalen 现在用 azure 的人变多了,越来越卡了,似乎 azure 也没有投入更多的资源来优化。我现在换 nvidia 的 deepseek api 了,超级快~
    kakakakaka8889
        42
    kakakakaka8889  
       7 天前
    @ggbbddjm #38 这代金券没法用啊,充值也没有代金券选项
    Neytoph
        43
    Neytoph  
       7 天前
    tiandee
        44
    tiandee  
       7 天前
    @chenluo0429 感谢大佬分享使用体验,我试试火山的
    ggbbddjm
        45
    ggbbddjm  
       7 天前
    @kakakakaka8889 直接点那个奖励金额旁边的 [去使用]
    pig198x
        46
    pig198x  
       7 天前
    @a1lenyang 不会,收费的是没有 rate limit 的,免费的有,好像一分钟 15 次。
    mingtdlb
        47
    mingtdlb  
       6 天前
    @Neytoph 好奇你们做云的,跑大模型是直接物理机跑,还是虚拟化一层 显卡直通给虚拟机跑?
    jerrywolf
        48
    jerrywolf  
       6 天前
    @chenluo0429
    +1 ,pro 是要自己充值;非 pro 可以用送的 2000w ,非 pro 其實不算特別慢了;但 pro 幾乎秒回,然而有種錯覺 pro 的推理和答案似乎有點短?
    dai269619118
        49
    dai269619118  
       6 天前 via iPhone
    我试了 硅基流动和阿里云的速度都慢
    schuman
        50
    schuman  
       6 天前
    cherry-studio + 硅基流动
    tiandee
        51
    tiandee  
       6 天前
    @JensenQian 哪个黄老板啊
    JensenQian
        52
    JensenQian  
       6 天前
    @tiandee 英伟达的黄老板,穿皮衣的
    montaro2017
        53
    montaro2017  
       5 天前
    用的阿里百炼的,速度还挺快的,免费额度也挺多
    客户端用的 ChatGPT-NextWeb ,之前配置过 OpenAI 的,现在配置了第三方 DeepSeek 的,可以同时使用
    ggbbddjm
        54
    ggbbddjm  
       5 天前   ❤️ 1
    有测评了
    DeepSeek-R1 网页端稳定性首测:12 家第三方平台真实测评
    https://mp.weixin.qq.com/s/oPjtUX7VVy1CLPL8b27mww
    taine221
        55
    taine221  
       5 天前
    @spritecn #35 请问前端界面用的啥啊?
    lidawn
        56
    lidawn  
       5 天前
    欧派云邀请码 SAJZ0D
    Neytoph
        57
    Neytoph  
       5 天前
    @mingtdlb 物理机跑那就不叫云了,成机器转租了,哈哈哈
    jqsl2012
        58
    jqsl2012  
       5 天前
    欧派云邀请码 TQ4IJD
    linqy
        59
    linqy  
       5 天前
    欧派云邀请码 LYMPES
    copriwolf
        60
    copriwolf  
       5 天前
    欧派云确实目前实际测试比较稳定~ [WGAMMI] 有需要可以多拿 五千万的 token
    jerrywolf
        61
    jerrywolf  
       5 天前
    字节这个用完还能买吗~性价比高不
    dongpeng121
        62
    dongpeng121  
       3 天前 via iPhone
    OEW4U0 ,派欧云邀请码
    YiCherish
        63
    YiCherish  
       3 天前 via iPhone
    4OU7FJ 派欧云
    yishao
        64
    yishao  
       2 天前
    试了这么多,满血版里火山引擎是最快的。
    spritecn
        65
    spritecn  
       2 天前
    @taine221 优先推荐 BotGem,简洁方便启动快但不支持发图片,也可以考虑 chatBox,这个支持给 deepseek 发图片,但启动速度略慢
    IMelon
        66
    IMelon  
       2 天前
    欧派云邀请码 2YZTC1
    yuhuij
        67
    yuhuij  
       2 天前
    微软 azure
    bronyakaka
        68
    bronyakaka  
       16 小时 57 分钟前
    @ggbbddjm #38 你这送的 token 只能用三个月
    SuujonH
        69
    SuujonH  
       4 小时 46 分钟前
    欧派云邀请码 AUTEOT
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1168 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 23:06 · PVG 07:06 · LAX 15:06 · JFK 18:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.