V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
jiom
V2EX  ›  云计算

挺无语的,局方为了提高服务器资源利用率,年年都改个规则

  •  
  •   jiom · 8 天前 · 5926 次点击

    挺无语的,局方为了提高服务器资源利用率,年年都改个规则,今年更变态了 云资源缩容利用率指标(属于低负载): 1.VCPU: [ VCPU 平均利用率<8%日峰值利用率<60%] 2 、内存: [内存平均利用率< 10% 且峰值利用<60%]

    云资源利用率指标(不属于低负载): 1.VCPU: [ VCPU 平均利用率 ≥8%或峰值利用率 >60%) 2.内存: [内存平均利用率≥10% 或峰值利用 ≥60%]

    好了,现在又要重新动态获取保证 cpu 与内存同时达标才行,上一年是 cpu 与内存满足一个要求就行,因此直接默认跑个 tomcat 把内存占满足平均利用率即可,今年开始 cpu+内存都同时满足。都什么脑子呢

    41 条回复    2025-02-13 14:24:01 +08:00
    cdlnls
        1
    cdlnls  
       8 天前 via Android   ❤️ 3
    提高服务器资源利用率我觉得完全没问题。能理解并且支持。
    cndns
        2
    cndns  
       8 天前
    https://devin.com/lookbusy/ 这个可以满足你
    967182
        3
    967182  
       8 天前
    用不上的资源为什么不释放掉??
    gitnot
        4
    gitnot  
       8 天前
    @967182 释放容易, 但是要用时申请麻烦吧
    jiom
        5
    jiom  
    OP
       8 天前
    @967182 从申请到通过,流程要走半年+,因此每年申请资源都会做多点,导致部分资源是还没用上的。
    cdlnls
        6
    cdlnls  
       8 天前 via Android   ❤️ 7
    @967182 并不是释放的问题,据我的观察,最少 70%的开发对自己开发的系统,需要用多少资源、能用多少资源,是需要内存还是 CPU 还是磁盘 IO 读写,这些问题完全没啥概念。然后配置就直接拉满了。

    就直接导致了上线之后各种资源使用率 0%的情况。
    Cu635
        7
    Cu635  
       8 天前
    这个涉及到价格问题么?缩容了之后价格还是原来的么?
    而且缩容有了,那么扩容呢?扩容方便不?
    jiom
        8
    jiom  
    OP
       8 天前
    @Cu635 缩容方便,扩容需要申请流程很麻烦~
    me1onsoda
        9
    me1onsoda  
       8 天前
    局方是谁
    summerwar
        10
    summerwar  
       8 天前
    写个脚本擦边跑就是了,规则随便改
    Cu635
        11
    Cu635  
       8 天前
    @jiom #8
    如果不涉及价格问题的话,那确实是人家缩容合理。
    不过扩容的话,应该还是时间太长了,走流程没问题,你 1 个 2 个自然日就给走完了啊,扩容拖半年+,再缩容就是不合理了。除非说缩容也是半年一次,看半年之内的使用率指标。
    povsister
        12
    povsister  
       8 天前 via iPhone
    平均 8%没问题啊,日均都做不到说明你们纯纯申请多了。
    beginor
        13
    beginor  
       8 天前 via Android
    都是跑个脚本拉一下利用率
    fcten
        14
    fcten  
       8 天前
    CPU 日峰值 60% 也太高了,这不是稍微来点突发流量就挂了
    我们只要求 CPU 日峰值不低于 30%
    除非你们有弹性扩容
    wangtian2020
        15
    wangtian2020  
       8 天前
    没事的,给他服务器配置缩到 9 块 9 一个月的学生服务器。他自己定的规则,关键时刻卡死他不就行了。不让他紧张一下真以为服务器是放着吃白饭的,公司员工的利用率比较低也是在吃白饭的
    wangtian2020
        16
    wangtian2020  
       8 天前
    他要利用率达标就给他达标呗,打工的关心这个?顶多建议一下,发个邮件留痕,出事了看🎆偷着乐就行了
    lambdaq
        17
    lambdaq  
       8 天前
    我觉得这个指标看上去没啥大问题啊。。。

    换个问法。如果这些服务器省下的钱都给你,你愿意去优化么?
    chairuosen
        18
    chairuosen  
       8 天前
    扩容慢了出事他们负责就行
    Charlie17Li
        19
    Charlie17Li  
       8 天前
    @cdlnls 比较好奇如何去评估一个合理的资源,我们这边标配是 4c8g
    yulgang
        20
    yulgang  
       8 天前
    避免类似这样的情况发生。

    knightgao2
        21
    knightgao2  
       8 天前
    改成按量付费就行,给钱了你爱空着就空着。
    v2wp
        22
    v2wp  
       8 天前
    大佬博客主题改得很棒啊,能分享否?感谢😁
    catamaran
        23
    catamaran  
       8 天前
    我们在银行系统的产品,cpu 高了报警。。。
    hasdream
        24
    hasdream  
       8 天前
    用某政务云, 每个季度考核资源使用率(cpu >= 40% 内存 >=40% 磁盘 >= 50%), 达不到就降配。 申请的时候走了一个月流程。 扩容也要各个领导层层审批。 还得问具体那块用资源比较多。
    Jinnrry
        25
    Jinnrry  
       8 天前
    啊?峰值 cpu<60%才达标吗?我这个 cpu 如果小于 60%运维已经开始打电话找人了。
    conn4575
        26
    conn4575  
       8 天前 via Android
    提高资源利用率完全没问题,但是前提是具备快速扩容的能。现在好多公司就跟楼主公司一样,扩容流程几个月起步,业务为了满足快速扩容不得不提前预留资源,说白了就是云的那一套没玩明白,申请个资源都做不到流程化快速审批
    realpg
        27
    realpg  
       7 天前
    @cdlnls #6
    大胆点 99%
    cdlnls
        28
    cdlnls  
       7 天前
    @realpg 70% 确实是保守了,说多了我怕被喷。。。
    ovtfkw
        29
    ovtfkw  
       7 天前
    局方是什么
    zsh2517
        30
    zsh2517  
       7 天前
    如果不查程序进程,一般来说,一个 while(1) 恰好吃满一个 CPU (以前冬天我拿 4 个死循环暖过手)。

    一般的监控都是区间采样计算平均的。也就是说,如果在极短的时间内,按照比例循环/闲置,就能实现在监控上表现出特定占用的 CPU ,效果如图,我觉得还挺满意的/doge

    https://i.imgur.com/Gceq5V2

    代码 AI 写的: https://pastebin.com/2LrwDN6b 。其他语言自行翻译一下,开个线程直接跑就行。看你提到了 tomcat ,java 有层虚拟机,能不能这么玩就不清楚了

    ---

    感觉理论上还可以自己再开一个线程读取目前占用情况,业务程序占用上升的时候就适当地减少一些,比如上升 10% 就减少个 5%,看起来请求多的时候就会有上升,但是又留了释放的余地
    zsh2517
        31
    zsh2517  
       7 天前
    图片我发的好像有问题,https://imgur.com/a/Gceq5V2 这个可能能打开?
    zsh2517
        32
    zsh2517  
       7 天前
    mayli
        33
    mayli  
       7 天前
    @jiom 那就是浪费了吧
    jiom
        34
    jiom  
    OP
       7 天前
    @povsister 前面申请都是会预留多点资源的,不然流程麻烦

    @beginor 是的,现在基本上都是 java 服务,有时候 cpu 利用率会不满足,内存问题不大,如果闲置资源基本上都会上脚本

    @wangtian2020 不能以这种思维去衡量~

    @lambdaq 我是没啥问题的,主要这个指标 1 年变一次,或者半年来一次,最近也上了其他考核,这个考核只是一小部分

    @chairuosen 不会的,出了故障还要我们写报告呢

    @v2wp https://github.com/solstice23/argon-theme 这位大佬的主题,您看看

    @hasdream 也是在用你说的云(狗头)
    huzhizhao
        35
    huzhizhao  
       7 天前
    这不上脚本加加压力
    gxt92
        36
    gxt92  
       7 天前
    正常,大数据局为了预算只能减配
    lujiaosama
        37
    lujiaosama  
       7 天前
    @hasdream 这么搞, 一年用几次, 一次一段时间的这种服务岂不是一用就炸?
    hullhutt
        38
    hullhutt  
       7 天前
    @cndns #2 不知道会不会影响程序运行,正好也缺这个
    Wh0amis
        39
    Wh0amis  
       7 天前
    运营商么,去年还写了个程序专门占资源率
    cndns
        40
    cndns  
       7 天前
    @hullhutt 不会
    SZhan
        41
    SZhan  
       7 天前
    @me1onsoda 应该是大数据局,公司项目都是政府项目,正式服务器靠大数据局下发,他们就有这种脑残需
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3309 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 11:30 · PVG 19:30 · LAX 03:30 · JFK 06:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.