Skip to content
尊敬的客戶,
您好,阿里雲對象存儲OSS(Object Storage Service)是阿里雲提供的海量、安全、低成本、高可靠的雲存儲服務。其數據設計持久性不低於99.9999999999%(12個9),服務可用性(或業務連續性)不低於99.995%。目前發現您阿里雲賬號下的 Bucket 出現可用性(5xx)降低的潛在風險,建議您按照如下思路檢查:
- 1、如果發現客戶端側出現 504/502/503 的場景,可以嘗試 ping 延遲是否穩定、MTR 鏈路是否存在間接性丟包、telnet 服務端 80/443 端口是否正常通信。如果發現網絡異常,需要先排除掉客戶端的網絡鏈路異常後再向下分析。
- 2、如果發現客戶端側出現 500 的場景並且復現頻率較高,可以先通過 try catch 機制捕獲到異常後合理進行重試,記錄下異常的 requestID 儘快反饋到阿里雲售後進行分析。
- 3、如果是 ECS 通過公網訪問 OSS 出現了 5xx ,檢查您的 ECS 是否有公網帶寬超過限制、網卡持續跑滿的情況。帶寬超限後應及時擴容 ECS 帶寬,避免帶來業務影響。
- 4、檢查 ECS 主機的網絡連接數、文件描述符的數量是否出現瓶頸,可能導致 SocketTimeOut 的問題出現。根據主機的負載情況、實例規格,合理的設置併發數量,優化業務代碼。
- 5、檢查客戶業務代碼中初始化配置的, MaxConnections、SocketTimeout、ConnectionTimeout 參數是否合理,弱網情況下應該適當放大。
- 6、檢查客戶是否配置過 OSS 鏡像回源功能,保證鏡像回源的站點可以正常通信,儘量不要對 OSS 回源 IP 設置防火牆策略, OSS 鏡像回源採用的是公網 IP 回源,定期會進行 IP 或者 IP 段的更換,如果客戶的原站設置了防火牆,可能出現 5xx 的回源超時