Tiêu dùng thông minh
ISSCC2021: Chip trí tuệ nhân tạo
Anh Sơn - Thứ Năm, 18/02/2021 1:56 CH
Vietnet24h - Với chip ISSCC, một phiên bản được thiết lập 9 lớp mỏng như tờ giấy cho bộ xử lý nghiêng máy (ML).
Đây là một phiên bản đóng gói, với chín lớp, trên các chip từ bộ xử lý 5nm và 7nm để sử dụng trên điện thoại di động và đám mây, cho đến các bộ gia tốc dành riêng cho ứng dụng tiêu thụ điện năng cực thấp dành cho thiết bị đeo được.

IBM và Samsung đều giới thiệu bộ xử lý ML cho điện thoại, trong đó xử lý AI cục bộ sẽ loại bỏ nhu cầu tham gia đám mây, miễn là các kiến ​​trúc đủ mạnh và đủ linh hoạt để đối phó với khối lượng công việc đa dạng - có thể cấu hình lại để phù hợp với các mạng nơ-ron khác nhau một chút -chiều rộng, số lớp và các kích thước khác có sẵn cho chúng.
IBM’s là chip 4 nhân 7nm với 25,6Tflop / s khả dụng cho đào tạo FP8 ‘hybrid’ và 102,4Top / s cho hội nghị INT4 (xem sơ đồ).
 
Dấu phẩy động lai 8bit (HFP8) là một định dạng được phát minh tại IBM (được tiết lộ vào năm 2019) như một cách khắc phục những hạn chế của định dạng dấu phẩy động 8bit tiêu chuẩn (1 dấu, 5 số mũ, 2 phần định trị) FP8, hoạt động tốt khi đào tạo một số mạng nơ-ron tiêu chuẩn, nhưng dẫn đến độ chính xác kém khi đào tạo người khác. Hybrid FP8 sử dụng 4 số mũ và 3 bit phần định trị để truyền về phía trước, sau đó là 5 số mũ và 2 bit phần định trị để truyền ngược, tăng đáng kể độ chính xác của quá trình huấn luyện, theo công ty.
 
Bốn lõi được liên kết bằng một cặp vòng dữ liệu nhanh rộng, một để truyền theo chiều kim đồng hồ và một để truyền ngược chiều kim đồng hồ. Chúng có thể được đóng trong chip, hoặc được mở và định tuyến qua bộ nhớ ngoài hoặc nhiều chip giống hệt nhau để xử lý các mạng lớn hơn. Các vòng và lõi không đồng bộ để cho phép các tốc độ xung nhịp khác nhau trao đổi năng lượng cho hiệu suất một cách riêng biệt.
 
Mỗi lõi được chia thành hai lõi phụ dùng chung bộ nhớ bàn di chuột, sau đó mỗi lõi phụ có một mảng động cơ 8 × 8 được tối ưu hóa để tăng tốc tích chập và nhân ma trận với các đường ống riêng biệt để tính toán dấu phẩy động và điểm cố định - cùng cung cấp Khả năng FP16, HFP8, INT4 và INT2 cho cả đào tạo và suy luận AI.
 
Chip 36mm2 được sản xuất bằng cách sử dụng kỹ thuật in thạch bản EUV và đạt được các chỉ số hiệu suất ở trên với 0,75V trên lõi và 0,95V trên SRAM. Sử dụng kiến ​​thức mạng thu thập được khi mạng được biên dịch, chip có thể điều chỉnh các lớp mạng ngốn điện để duy trì trong phạm vi ngân sách năng lượng. Hoạt động danh nghĩa (lõi 0,55V, 0,7V SRAM) mang lại xung nhịp 1GHz và duy trì 3,5Tflop / s / W FP8 và 16Top / s / W INT4.
 
Bộ xử lý AI di động của Samsung nhỏ hơn, với kích thước 5,46mm2 và sử dụng quy trình 5nm để triển khai tổng cộng ba lõi của nó và có thể thực hiện 623 suy luận/s.
 
Mỗi lõi có hai lõi phụ ('động cơ tích hợp') cùng với một đơn vị xử lý vectơ và 1Mbyte bàn di chuột. Mỗi lõi phụ có trọng số - bản đồ tính năng - tìm nạp tổng một phần và một mảng 1.024 MAC - vì vậy> 6.000 MAC trên chip). Nó có thể thực thi 64 sản phẩm chấm của vectơ 16 chiều trên mỗi chu kỳ. Bàn di chuột chứa tất cả các trọng số, bản đồ tính năng đầu vào, bản đồ tính năng đầu ra và tổng một phần cho một lớp hoặc, nếu lớp lớn để phù hợp cùng một lúc, hãy xếp chồng lên lớp đó. Một đơn vị xử lý vectơ thực hiện các chức năng phi tuyến tính phức tạp như chuẩn hóa và softmax.
 
Không giống như các bus vòng của IBM, các lõi trong trường hợp này được kết nối bằng một bus thông thường hơn sử dụng DMA (truy cập bộ nhớ trực tiếp).
 
Để tiết kiệm quá trình xử lý lãng phí và do đó, năng lượng, tính năng không bỏ qua bản đồ được triển khai. “Việc sử dụng MAC trên các lớp phức hợp trong Inception-V3 có thể được cải thiện trung bình 36% bằng tính năng không bỏ qua bản đồ tính năng,” theo bản trình bày của ISSCC. “Không giống như không bỏ qua trọng lượng, tính năng không bỏ qua bản đồ nâng cao hiệu suất hiệu quả và tiết kiệm năng lượng mà không cần bất kỳ bước đào tạo bổ sung nào như cắt giảm trọng lượng.
 
Con chip này chạy từ 550mV đến 900mV, và 332Mz đến 1.2GHz xung nhịp. Công suất và hiệu suất được đo trong khi chạy các lớp tích hợp, gộp và được kết nối đầy đủ của mẫu 8bit Inception-V3 mà không cần cắt bớt trọng lượng. Thông lượng suy luận tổng thể là 194 suy luận / s ở 332MHz và 623 suy luận / s ở 1.196GHz ở chế độ ưu tiên thông lượng tương đương với hoạt động của CPU đa luồng. 1.190 suy luận / J được đo ở 0,6V, tương ứng với 13,6Top / s / W cho Inception-V3.
 
Trên mỗi khu vực, chip Samsung đạt 2,69Top / s / mm2 và 114 suy luận / s / mm2.
 
Về khía cạnh nhỏ bé, Đại học Công nghệ Nanyang từ Singapore và Đại học Columbia đã xem xét trí tuệ nhân tạo vi năng lượng. Nanyang đã trình bày một hệ thống nhận dạng cử chỉ tay trong thời gian thực cho các thiết bị có thể đeo và IoT, hoạt động bằng cách kiểm tra dữ liệu cạnh từ hình ảnh VGA (640x480x8bit), tiếp theo là bộ phân loại nhỏ gọn kết hợp để nhận dạng cử chỉ tĩnh và một bộ phân tích trình tự có khả năng chịu lỗi để nhận dạng cử chỉ động .
 
Chip 65nm 1,5mm2 có thể nhận dạng 24 cử chỉ động với độ chính xác trung bình là 92,6%, tất cả đều cho 184μW ở 0,6V.
 
Bộ xử lý của Columbia là công cụ phát hiện từ khóa luôn chạy 65nm được thiết kế để hoạt động trong điều kiện nhiễu nền. Huấn luyện không phụ thuộc vào tiếng ồn thông thường hơn - huấn luyện với nhiều mức độ và loại tiếng ồn khác nhau - sẽ dẫn đến một mạng lưới thần kinh quá lớn, vì vậy nhóm đã sử dụng một sơ đồ lấy cảm hứng từ sinh học đơn giản hơn gọi là 'bình thường hóa năng lượng chia'. Quá trình xử lý được trải rộng trên một chip "chiết xuất tính năng âm thanh chuẩn hóa" lấy tín hiệu âm thanh từ micrô và tạo ra các tính năng được mã hóa tốc độ tăng đột biến (cho 109nW) và chip phân loại mạng thần kinh tăng đột biến.
 
Đối với công suất 570nW, hệ thống hai chip đạt độ chính xác 89 - 94% trên tỷ lệ tín hiệu trên nhiễu từ -5 đến 20dB với bốn loại nhiễu khác nhau (bộ dữ liệu HeySnips). Về khả năng, độ chính xác là 96,5% khi tìm kiếm một từ khóa hoặc 90,2% khi tìm bốn từ khóa.
 
Chip lớp mỏng ISSCC 9.1 Một chip AI 4 nhân 7nm với đào tạo FP8 lai 25,6Tclops, suy luận INT4 102,4Tops và điều chỉnh khối lượng công việc nhận biết
 
Chip lớp mỏng ISSCC 9.5 Một đơn vị xử lý thần kinh nhận biết tính năng 6k-MAC-bản đồ-độ thưa thớt trong SoC di động hàng đầu 5nm
 
Chip lớp mỏng ISSCC 9.7 Một hệ thống nhận dạng cử chỉ tay theo thời gian thực 184µW với các bộ phân loại siêu nhỏ kết hợp cho các thiết bị đeo thông minh
 
Chip lớp mỏng ISSCC 9.9 Một bộ chiết xuất tính năng âm thanh 109nW chịu được nhiễu nền và biến đổi quy trình dựa trên chuẩn hóa năng lượng chia miền tăng đột biến cho thiết bị phát hiện từ khóa luôn bật.
Qualcomm phản đối việc mua lại Arm 40 tỷ đô la của Nvidia Vietnet24h - Theo các nguồn tin quen thuộc với vấn đề này, Qualcomm đã nói với các nhà quản lý trên toàn thế giới rằng họ chống lại việc Nvidia mua lại nhà thiết kế chip Arm người Anh trị giá 40 tỷ USD.
Theo EW
Tin khác cùng chuyên mục
Tin đọc nhiều
Samsung Galaxy A56 5G, Galaxy A36 5G và Galaxy A26 5G chính thức có mặt trên toàn cầu Vietnet24h - Samsung Electronics vừa chính thức công bố sự ra mắt toàn cầu[1] của Galaxy A56 5G, Galaxy A36 5G và Galaxy A26 5G, đánh dấu bước tiến quan trọng trong hành trình mở ra vô vàn trải nghiệm mới cho người dùng nhờ công nghệ AI di động tiên tiến.
Chờ đợi AI: Khi smartphone mắc kẹt trong kỳ vọng Vietnet24h - AI được kỳ vọng sẽ cách mạng hóa smartphone, nhưng thực tế, nó chỉ dừng lại ở việc tối ưu ảnh, dịch thuật hay hỗ trợ một số tác vụ cơ bản. Trong khi đó, các cải tiến về camera, pin và thiết kế lại giậm chân tại chỗ. Liệu chúng ta có đang lãng phí cả một thế hệ phần cứng để chờ đợi AI hoàn thiện?
Điện thoại gập Pura X của Huawei thúc đẩy sự thay thế của Apple và Google Vietnet24h - Huawei đã ra mắt điện thoại thông minh có thể gập lại Pura X vào thứ năm tuần này với mức giá khởi điểm là 7.499 Nhân dân tệ Trung Quốc (1.037 đô la).
Google công bố bản cập nhật AI chăm sóc sức khỏe mới cho mục Tìm kiếm Vietnet24h - Công ty cho biết họ đã mở rộng các bảng kiến ​​thức để bao gồm thêm "hàng nghìn" chủ đề về sức khỏe và các bảng kiến ​​thức này sẽ có mặt ở nhiều quốc gia và ngôn ngữ hơn.
Công nghệ màn hình chấm lượng tử của Samsung đạt chứng nhận không chứa Cadmium từ SGS Vietnet24h - Chứng nhận từ SGS xác nhận rằng màng chấm lượng tử có trong sản phẩm không chứa cadmium và đáp ứng các tiêu chuẩn theo quy định RoHS
Meta’s Community Notes sẽ sử dụng công nghệ nguồn mở từ X của Elon Musk Vietnet24h - Meta cho biết hôm thứ Năm rằng công cụ kiểm duyệt nội dung cộng đồng mới mang tên Community Notes sẽ sử dụng thuật toán nguồn mở từ X.
Apple hoãn cải tiến Siri AI đến năm 2026 Vietnet24h - Hôm qua, thứ Sáu (7/3), Apple đã thông báo rằng, họ sẽ trì hoãn các tính năng sẽ hỗ trợ Siri với khả năng làm việc với các ứng dụng khác cho đến năm sau. Tính năng đó dự kiến ​​sẽ được phát hành vào mùa xuân này.
Công ty khởi nghiệp điện thoại thông minh Nothing cố gắng khuấy động thị trường với chiếc điện thoại giá 400 đô la Vietnet24h - Công ty khởi nghiệp công nghệ tiêu dùng Nothing đã ra mắt điện thoại thông minh Phone (3a) mới vào thứ ba (4/3).
Microsoft ra mắt trợ lý AI kích hoạt bằng giọng nói mới dành cho bác sĩ Vietnet24h - Hôm nay, thứ Ha (3/3)i, Microsoft đã công bố một trợ lý AI chăm sóc sức khỏe mới có tên Dragon Copilot, được xây dựng dựa trên các giải pháp nghe chính tả và lắng nghe xung quanh hiện có.
Xiaomi ra mắt điện thoại giá 1.600 đô la khi giá cổ phiếu tăng 300% lên mức cao kỷ lục Vietnet24h - Xiaomi đã ra mắt Xiaomi 15 và Xiaomi 15 Ultra vào Chủ Nhật tại Đại hội Thế giới Di động (MWC) 2025. Xiaomi 15 có giá khởi điểm là 999 euro (1.047 đô la) và Xiaomi 15 Ultra có giá khởi điểm là 1.499 euro (1.571 đô la).
Giải pháp đánh bay hôi miệng, lấy lại tự tin trong giao tiếp Vietnet24h - Hôi miệng không chỉ là vấn đề về sức khỏe mà còn ảnh hưởng trực tiếp đến sự tự tin và giao tiếp hàng ngày, đặc biệt đối với những người làm công việc tư vấn, kinh doanh hoặc giao tiếp trực tiếp. Mùi hôi khó chịu từ miệng khiến bạn gặp khó khăn trong các cuộc trò chuyện, khiến người khác ngại ngùng và ảnh hưởng đến mối quan hệ xã hội. Tuy nhiên, đừng lo lắng, vì những giải pháp đơn giản có thể giúp bạn khắc phục tình trạng này một cách hiệu quả.
Giới chức Mỹ kiện TikTok vì lo ngại thanh thiếu niên bị ảnh hưởng bởi nghiện mạng xã hội Vietnet24h - TikTok, nền tảng video nổi tiếng, đã trở thành mục tiêu của các vụ kiện từ 13 bang ở Mỹ, với cáo buộc gây nghiện cho thanh thiếu niên và làm tổn hại đến sức khỏe tâm thần của họ thông qua những thuật toán được thiết kế để tăng thời gian sử dụng.
Cách sử dụng ChatGPT vừa ra mắt chế độ giọng nói nâng cao cho trò chuyện âm thanh của OpenAI Vietnet24h - Mặc dù công cụ này phản hồi nhanh và có thể nói bằng nhiều giọng khác nhau, nhưng bạn có thể gặp phải giới hạn về tốc độ nếu sử dụng nhiều lần trong một ngày.
Đánh giá sơ bộ về iPhone 16 mới ra lò của Apple Vietnet24h - iPhone 16 Pro Max có thời lượng pin tốt hơn và camera tuyệt vời, nhưng Apple Intelligence vẫn chưa xuất hiện
Apple Watch Series 10 chỉ có những nâng cấp nhỏ, nhưng điểm cộng lớn là sạc nhanh hơn Vietnet24h - Apple Watch là một phần của bộ phận Thiết bị đeo, Gia đình và Phụ kiện của công ty, đã báo cáo doanh thu 8,1 tỷ đô la trong quý tài chính thứ ba, giảm 2% so với một năm trước.
Apple phát hành iOS 18 cho iPhone, nhưng không bao gồm Apple Intelligence Vietnet24h - Đây là bản cập nhật iPhone lớn nhất trong năm của Apple, nhưng bản cập nhật này không bao gồm Apple Intelligence, hệ thống AI sắp ra mắt của công ty.
Lý do nhiều người không ưa chuộng smartphone màn hình gập Vietnet24h - Đã nhiều năm trôi qua kể từ khi smartphone màn hình gập lần đầu tiên xuất hiện, nhưng doanh số của thiết bị đầy sáng tạo này vẫn chưa thể cạnh tranh với smartphone thông thường. Dù các thương hiệu liên tục thúc đẩy sản phẩm ra thị trường, nhiều người vẫn tỏ ra không mặn mà với dòng sản phẩm này. Vậy điều gì khiến smartphone màn hình gập chưa thể đạt được thành công mong đợi? Hãy cùng khám phá.
Liệu trẻ em có nên dùng Apple Watch? Vietnet24h - Apple vừa tung ra một trang web tiếp thị mới, quảng cáo Apple Watch như một cách để các bậc cha mẹ giữ liên lạc với con cái của họ.
Đánh giá sơ bộ về máy tính bảng Surface Pro của Microsoft Vietnet24h - Phiên bản thứ 11 của máy tính bảng chuyển đổi Surface Pro của Microsoft dựa trên chip Qualcomm tiêu thụ năng lượng, dẫn đến thời lượng pin hơn 8 giờ trong các thử nghiệm ban đầu.
Cảnh báo: mạng lưới lừa đảo với chiêu thức giả mạo ứng dụng bảo hiểm xã hội số Vietnet24h - Trong bối cảnh không gian mạng ngày càng trở nên phức tạp, Cục An toàn thông tin, thuộc Bộ Thông tin và Truyền thông, đã phát đi một thông báo khẩn cấp về những chiêu trò lừa đảo mới mẻ, đặc biệt là các vụ việc giả mạo ứng dụng VssID - Bảo hiểm xã hội số.