AI và 5G tăng chi phí năng lượng thành gánh nặng vận hành
Phần lớn người dùng không biết một truy vấn trên ChatGPT tiêu tốn điện năng gấp gần 10 lần so với một tìm kiếm Google thông thường và nếu là truy vấn phức tạp cần suy luận nhiều bước, con số này có thể vọt lên gấp 20 lần.
Khi nhân với hàng trăm triệu người dùng mỗi ngày thì lúc đó tất cả sẽ hiểu tại sao AI và 5G tăng chi phí năng lượng đang trở thành mối lo hàng đầu của các doanh nghiệp hạ tầng số trên toàn cầu.
Trong cùng thời điểm, hạ tầng 5G đang được triển khai ồ ạt.
Mỗi trạm 5G tiêu thụ điện năng gấp 3-4 lần so với trạm 4G tương đương, trong khi mật độ trạm cần lắp đặt lại dày hơn nhiều do bước sóng ngắn của tín hiệu mmWave.
Vì vậy ngành viễn thông đang chịu áp lực năng lượng kép vừa từ AI vừa từ 5G xảy ra đồng thời.
Đây chính là nghịch lý cốt lõi của thập kỷ chuyển đổi số vì dù được kỳ vọng làm mọi thứ hiệu quả hơn nhưng AI và 5G tăng chi phí năng lượng ở mức chưa từng có trong lịch sử ngành viễn thông.
Các dự báo cho thấy công suất trung tâm dữ liệu toàn cầu cần tăng từ 2 đến 6 lần vào năm 2030, và chi tiêu cho hạ tầng AI có thể chạm mốc 2,5 nghìn tỷ USD chỉ tính đến năm 2026.
Với doanh nghiệp viễn thông, nhà cung cấp hạ tầng số và các tổ chức vận hành trung tâm dữ liệu, đây không còn là câu chuyện kỹ thuật mà là bài toán tài chính cần giải quyết ngay hôm nay.
Nguyên nhân gây tăng chi phí
Nhu cầu tính toán bùng nổ
Khi hiệu quả mạng lưới được đo bằng mili giây và megabit, hạ tầng tính toán cần thiết để duy trì các mạng viễn thông tích hợp AI đang trở thành một trong những thách thức tài chính nan giải nhất của ngành.
Đưa AI vào mạng viễn thông dù là để tối ưu hóa lưu lượng theo thời gian thực, bảo trì dự đoán hay cung cấp các dịch vụ thông minh mới đòi hỏi năng lực xử lý ở quy mô mà chỉ một thập kỷ trước còn nằm ngoài trí tưởng tượng.
Các dự báo của ngành rất rõ ràng: đến năm 2030, dung lượng trung tâm dữ liệu cần tăng gấp từ hai đến sáu lần chỉ để đáp ứng khối lượng công việc mà AI và 5G đặt ra cho hạ tầng mạng.
Nguyên nhân kỹ thuật của mức tăng trưởng theo cấp số nhân này nằm ở bản chất của tính toán AI.
Khác với các hệ thống quản lý mạng truyền thống dựa trên quy tắc cứng, các mô hình AI đặc biệt là kiến trúc học sâu dùng cho phát hiện bất thường, phân bổ phổ tần động và network slicing đòi hỏi các chu kỳ liên tục gồm:
- Thu thập dữ liệu.
- Suy luận mô hình.
- Tái huấn luyện theo thời gian thực.
Điều này càng trở nên phức tạp hơn khi kiến trúc 5G chuyển dịch sang mô hình điện toán đám mây gốc và điện toán phân tán.
Chúng đẩy yêu cầu xử lý từ các trung tâm tập trung ra ngoài các nút biên nên làm nhân lên nhiều lần số điểm tính toán cường độ cao trên toàn mạng.
Hệ quả thực tế là một nghịch lý mà các nhà khai thác buộc phải đối mặt trực tiếp.
Trong khi AI và 5G được quảng bá như những động lực thúc đẩy hiệu quả mạng thì chi phí năng lượng và đầu tư vốn để vận hành phần cứng hỗ trợ lại phần lớn bào mòn thậm chí trong nhiều trường hợp triệt tiêu hoàn toàn lợi ích hiệu suất kỳ vọng.
Với các nhà khai thác mạng, điều này đồng nghĩa với hoạch định đầu tư không thể đánh đồng năng lực AI với tiết kiệm chi phí.
Hai yếu tố này cần được đánh giá độc lập với sự tính toán rõ ràng về mức tiêu thụ năng lượng và chu kỳ thay mới phần cứng mà mạng thông minh đặt ra.
Ví dụ: Các nhà mạng lớn đang triển khai 5G theo từng giai đoạn một phần vì lý do này. Nâng cấp trạm BTS truyền thống lên các nút 5G tích hợp AI để quản lý lưu lượng thông minh đòi hỏi chi phí phần cứng và điện năng tăng đột biến, trong khi doanh thu từ dịch vụ chưa theo kịp tốc độ đầu tư.
Xu hướng dùng thiết bị từ nhiều nhà cung cấp
Yếu tố thứ hai đẩy chi phí lên cao không phải từ năng lực tính toán thuần túy, mà xuất phát từ sự phân mảnh cấu trúc của môi trường phần cứng mạng hiện đại.
Sự trỗi dậy của Open RAN là xu hướng nhằm tách rời các thành phần mạng, tạo điều kiện để nhà khai thác kết hợp thiết bị từ nhiều nhà cung cấp khác nhau.
Nó thể hiện một tầm nhìn hấp dẫn về tính tương tác và sự độc lập với nhà sản xuất.
Tuy nhiên trong thực tế lại tạo ra một tầng phức tạp vận hành với gánh nặng tài chính đáng kể.
Cốt lõi của thách thức này là sự thiếu chuẩn hóa trong cách các nhà sản xuất khác nhau đo lường, gán nhãn và báo cáo chỉ số hiệu suất mạng.
Mỗi nhà sản xuất vận hành trong một hệ thống riêng, quy ước đặt tên độc quyền, phương pháp đo lường và chuẩn mực hiệu suất không thể so sánh trực tiếp giữa các thương hiệu.
Với một nhà khai thác đang quản lý hạ tầng đa dạng nhà cung cấp, để so sánh ngang bằng giữa một trạm gốc (base station) của nhà sản xuất này với thiết bị tương đương của nhà sản xuất khác đòi hỏi thời gian kỹ thuật đáng kể, công cụ chuyển đổi tùy chỉnh và thường phải thuê tư vấn bên ngoài.
Tác động vận hành đặc biệt nghiêm trọng trong hai tình huống nhạy cảm: bàn giao tài sản và sáp nhập mua lại doanh nghiệp.
Nếu một nhà khai thác tiếp nhận hạ tầng của công ty khác, hoặc khi tài sản phải chuyển giao theo yêu cầu pháp lý.
Khi đó sự thiếu ngôn ngữ đo lường chung có thể khiến tiến độ tích hợp bị trì hoãn hàng tháng, phát sinh chi phí đối soát tốn kém và tạo ra rủi ro tuân thủ.
Với các nhà mạng lớn quản lý hàng nghìn nút mạng trên nhiều hệ sinh thái nhà cung cấp, sự không đồng nhất không phải là bất tiện nhỏ mà là một điểm yếu cấu trúc nhân lên qua từng quyết định mua sắm, chu kỳ kiểm tra và đợt nâng cấp hạ tầng.
Vì vậy, lợi thế linh hoạt mà Open RAN mang lại dù thực sự có giá trị cần được cân nhắc kỹ trước chi phí phối hợp ẩn mà nó kéo theo.
Ví dụ: Khi nhà mạng khu vực Đông Nam Á tiến hành M&A và tiếp nhận hạ tầng từ đối tác sử dụng thiết bị Ericsson trong khi hệ thống cũ chạy Nokia, đội ngũ kỹ thuật phải mất nhiều tháng chỉ để “dịch” các chỉ số KPI mạng sang cùng một hệ quy chiếu trước khi có thể bắt đầu tối ưu hóa hay lên kế hoạch đầu tư tiếp theo.
Tình hình tiêu thụ và nhu cầu năng lượng hiện nay
Nhu cầu sử dụng toàn cầu
| Chỉ số dự báo | Năm 2024 | Năm 2026 | Năm 2030 |
|---|---|---|---|
| Tiêu thụ điện TTDL toàn cầu | ~415 TWh | ~500 – 1.050 TWh | ~945 – 1.000+ TWh |
| Tỷ trọng điện năng toàn cầu | 1,5% | 2,0% | 3,0% – 4,0% |
| Chi tiêu cơ sở hạ tầng AI toàn cầu | — | ~2.500 tỷ USD | — |
| Tỷ trọng điện TTDL tại Mỹ | 4,4% | 4,6% – 9,1% | 12,0% |
Khả năng tiêu thụ năng lượng của AI
| Loại hình tác vụ | Ước tính năng lượng (Wh) | So sánh tương quan |
|---|---|---|
| Tìm kiếm Google truyền thống | 0,3 | Mức cơ sở |
| Truy vấn ChatGPT tiêu chuẩn | 2,9 | Gấp ~10 lần Google |
| Truy vấn lý giải (Reasoning query) | 6,2 | Gấp ~20 lần Google |
| Truy vấn ngữ cảnh dài (Long-context) | 14,1 | Gấp ~47 lần Google |
| Tạo 1.000 hình ảnh AI | — | Phát thải ≈ lái xe 4,1 dặm |
Giải pháp khắc phục
Dùng mã CLEI (Nhận diện thiết bị)
Trong một ngành mà các quyết định mua sắm có thể trói buộc nhà khai thác vào nhiều năm lãng phí năng lượng không cần thiết thì nắm trong tay dữ liệu thiết bị chính xác và chuẩn hóa là yêu cầu chiến lược sống còn.
Mã CLEI (Common Language Equipment Identifier) ra đời để đáp ứng trực tiếp nhu cầu này.
Được cấu thành từ chuỗi 10 ký tự chữ-số, CLEI hoạt động như một “hộ chiếu kỹ thuật” thu gọn cho từng thiết bị mạng, mã hóa toàn bộ các thông số vận hành quan trọng mà đội ngũ mua sắm và kỹ thuật có thể khai thác ngay từ giai đoạn lập kế hoạch ban đầu.
Về mặt kỹ thuật, mỗi mã CLEI chứa đựng các thông số chi tiết bao gồm:
- Mức tiêu thụ điện năng.
- Tốc độ tản nhiệt.
- Ngưỡng chịu đựng độ cao và độ ẩm.
- Dải nhiệt độ lưu kho và vận hành tối ưu.
Do đó giúp kỹ sư khớp chính xác năng lực thiết bị với điều kiện triển khai thực tế dù đó là trạm ăng-ten ở vùng cao hẻo lánh hay trung tâm dữ liệu đô thị được kiểm soát khí hậu nghiêm ngặt.
Thay vì phải dựa vào tờ thông số kỹ thuật của nhà cung cấp vốn thường được đo trong điều kiện lý tưởng, CLEI cung cấp dữ liệu chuẩn hóa, có thể so sánh được, làm nền tảng cho các phân tích khách quan.
Các nhà khai thác có thể tránh được việc mua thiết bị có công suất điện vượt xa nhu cầu vận hành thực tế vì đó là một sai lầm phổ biến và tốn kém trong những mạng lưới đang mở rộng nhanh chóng.
Lựa chọn thiết bị đúng với yêu cầu thực tế của từng địa điểm, thay vì cấu hình dư thừa, giúp kéo dài tuổi thọ thiết bị và tránh được các chu kỳ thay thế sớm vốn làm đội vốn đầu tư lẫn chi phí vận hành.
Quan trọng không kém, CLEI còn hỗ trợ người lập kế hoạch chọn vị trí lắp đặt không cần đến hệ thống làm mát tốn kém từ đó giảm trực tiếp chi phí OPEX.
Trong hệ sinh thái Open RAN nơi môi trường đa nhà cung cấp đòi hỏi khả năng tương tác và minh bạch về thông tin, mã CLEI đóng vai trò như một ngôn ngữ chung.
Nó giúp quá trình so sánh và lựa chọn thiết bị trở nên có hệ thống và đáng tin cậy hơn nhiều.
Ví dụ: Tại công ty viễn thông triển khai hạ tầng 5G tại các vùng cao nơi nhiệt độ ban đêm xuống thấp, độ ẩm cao và nguồn điện không ổn định mã CLEI giúp đội ngũ kỹ thuật nhanh chóng lọc ra các thiết bị radio đáp ứng đúng ngưỡng chịu đựng môi trườn, thay vì mua nhầm thiết bị thiết kế cho data center đô thị.
Dùng mã CLLI (Nhận diện vị trí)
Triển khai mạng hiệu quả phụ thuộc vào địa lý không kém gì công nghệ.
Đặt đúng thiết bị vào sai vị trí hoặc phủ sóng trùng lặp không cần thiết là một dạng lãng phí năng lượng âm thầm, thường chỉ lộ ra khi chi phí đã tích lũy đáng kể.
Mã CLLI (Common Language Location Identifier ) giải quyết vấn đề này bằng một chuỗi định danh chuẩn hóa 11 ký tự.
Nó xác định chính xác cả vị trí địa lý lẫn vai trò chức năng của từng địa điểm mạng.
Với các đội ngũ lập kế hoạch mạng, mã CLLI hoạt động như một công cụ phối hợp không gian.
Từ đó ngăn chặn triển khai trùng chéo, giảm nhiễu tín hiệu giữa các trạm lân cận, và loại bỏ đầu tư phần cứng dư thừa.
Khi nhiều nhà cung cấp hoặc nhóm kỹ thuật khác nhau cùng triển khai trong một dự án quy mô lớn, CLLI đảm bảo mỗi địa điểm được xác định rõ ràng và nhất quán, triệt tiêu rủi ro làm trùng công việc hoặc xung đột cấu hình.
Điều này đặc biệt có giá trị tại các đô thị dày đặc, nơi hiệu quả phổ tần và khoảng cách vật lý giữa các trạm phải được quản lý chặt chẽ để duy trì chất lượng dịch vụ.
Tầm quan trọng của CLLI còn mở rộng sang lĩnh vực điện toán biên nơi hiệu năng độ trễ gắn liền trực tiếp với khoảng cách vật lý từ tài nguyên tính toán đến người dùng cuối.
Nhờ xác định chính xác vị trí địa lý của các nút biên, mã CLLI giúp các kiến trúc sư mạng lập bản đồ độ trễ theo từng địa điểm cụ thể.
Từ đó đưa ra quyết định phân phối tác vụ thông minh, cân bằng giữa hiệu năng và tiết kiệm năng lượng.
Ngoài ra, các đội kỹ thuật viên được cử đến hiện trường có thể dùng CLLI như một tham chiếu tuyệt đối chính xác, tránh những sai lầm tốn kém do nhầm địa điểm.
Nhầm địa điểm khá phổ biến trong môi trường vận hành nhiều trạm quy mô lớn, dẫn đến những chuyến đi thực địa và chi phí nhân công hoàn toàn có thể tránh được.
Ví dụ: Trong dự án triển khai 5G dọc hành lang khu công nghiệp, nếu ba nhà thầu khác nhau cùng lắp đặt trạm gNB mà không có hệ thống định danh địa lý thống nhất.
Do đó rất dễ xảy ra tình trạng hai trạm đặt quá gần nhau gây nhiễu, trong khi một vùng khác lại bị bỏ sót.
CLLI ngăn chặn chính xác kịch bản lãng phí này.
Làm mát bằng chất lỏng
Khi mật độ nhiệt vượt quá giới hạn vật lý mà hệ thống làm mát bằng không khí có thể xử lý thì làm mát bằng chất lỏng trở thành một yêu cầu kỹ thuật bắt buộc.
Sự chuyển dịch này được thúc đẩy bởi tốc độ tăng mật độ công suất không ngừng của GPU và AI ASIC đã đạt đến mức mà hệ thống làm mát không khí không thể xử lý hiệu quả về cả mặt kinh tế lẫn kỹ thuật.
Ba công nghệ làm mát bằng chất lỏng chủ đạo đang nổi lên như tiêu chuẩn mới cho các Trung tâm dữ liệu AI:
- Direct-to-Chip (dẫn chất lỏng lạnh trực tiếp đến nguồn nhiệt trên bộ xử lý).
- Rear Door Cooling (dùng cửa sau làm mát bằng chất lỏng để thu nhiệt thải từ các dãy máy chủ).
- Immersion Cooling (nhúng toàn bộ module tính toán vào chất lỏng điện môi dẫn nhiệt).
Mỗi phương pháp có sự đánh đổi khác nhau giữa chi phí đầu tư hạ tầng ban đầu và tiết kiệm vận hành dài hạn.
Tuy nhiên tất cả đều có khả năng xử lý tải nhiệt mà hệ thống không khí về mặt vật lý không thể đảm đương.
Tại các cơ sở hyperscale hiệu quả nhất hiện nay, làm mát và kiểm soát môi trường chiếm khoảng 7% tổng tiêu thụ điện nhưng tại các triển khai doanh nghiệp kém tối ưu, con số này có thể vượt 30%.
Đây là một khoảng cách hiệu quả khổng lồ hoàn toàn có thể được thu hẹp.
Ngoài bài toán quản lý nhiệt ở trạng thái ổn định, hạ tầng AI hiện đại còn đặt ra thách thức thứ hai mà kiến trúc làm mát bằng chất lỏng phải giải quyết.
Đó là sự biến động cực đoan của biểu đồ công suất.
Khi các cụm GPU khởi động các tác vụ tính toán cường độ cao, mức tiêu thụ điện có thể tăng vọt vài trăm phần trăm chỉ trong vài mili-giây.
Hệ thống UPS và hạ tầng phân phối điện không chỉ phải được thiết kế cho công suất đỉnh mà còn cho khả năng phản ứng động để hấp thụ các cú tăng tải đột ngột mà không gây mất ổn định lưới điện cục bộ.
Yêu cầu này đang thúc đẩy hạ tầng điện tiến hóa thành các hệ thống thông minh, có khả năng dự báo có thể nhận biết trước các mẫu tải.
Chúng phải tự động tối ưu phân phối năng lượng và duy trì ổn định lưới điện ngay cả dưới những khối lượng công việc huấn luyện hoặc suy luận AI phức tạp nhất.
Ví dụ: Khi xây dựng AI Data Center phục vụ các mô hình ngôn ngữ lớn (LLM), việc lựa chọn giữa Direct-to-Chip và Immersion Cooling không chỉ là bài toán kỹ thuật mà còn là bài toán tài chính dài hạn.
Chi phí đầu tư ban đầu cho hệ thống nhúng chất lỏng cao hơn đáng kể nhưng PUE (Power Usage Effectiveness) đạt được có thể xuống dưới 1.1, so với mức 1.5–2.0 của hệ thống không khí truyền thống.
Điều này đồng nghĩa chi phí tiêu thụ điện tiết kiệm hàng triệu USD mỗi năm.
Có thể bạn quan tâm
Liên hệ
Địa chỉ
Tầng 6 184 Phương Liệt
Phường Phương Liệt
Thành phố. Hà Nội
info@comlink.com.vn
Phone
+84 98 58 58 247
