nvidia va google ket hop toi uu hoa gemma tren moi nen tang ai tang toc do va giam chi phi 1

NVIDIA và Google ra mắt Gemma: Tối ưu hóa AI mọi nền tảng

Viết bởiHải Vi IT Xuất bản24 Tháng Hai, 2024 3:35 Chiều +0724 Tháng Hai, 2024 3:38 Chiều +07 Cập nhật 24 Tháng Hai, 2024 3:38 Chiều +07

Hôm 21/02/2024, NVIDIA đã phối hợp cùng Google để ra mắt các tối ưu hóa trên tất cả các nền tảng AI của NVIDIA cho Gemma – những mô hình ngôn ngữ mới nhất với 2 tỷ và 7 tỷ tham số, có thể chạy trên bất kỳ nơi nào, giúp giảm chi phí và tăng tốc độ làm việc sáng tạo cho các trường hợp sử dụng cụ thể.

Các nhóm từ hai công ty đã cùng nhau làm việc chặt chẽ để tăng tốc hiệu suất của Gemma – được xây dựng từ cùng nghiên cứu và công nghệ được sử dụng để tạo ra các mô hình Gemini – với NVIDIA TensorRT-LLM, một thư viện mã nguồn mở để tối ưu hóa việc suy luận mô hình ngôn ngữ lớn, khi chạy trên GPU NVIDIA trong trung tâm dữ liệu, trên đám mây và cục bộ trên các máy trạm với GPU NVIDIA RTX hoặc PC với GPU GeForce RTX.

nvidia va google ket hop toi uu hoa gemma tren moi nen tang ai tang toc do va giam chi phi 2

Điều này cho phép các nhà phát triển nhắm vào cơ sở cài đặt hơn 100 triệu GPU NVIDIA RTX có sẵn trên các máy tính AI hiệu suất cao trên toàn cầu.

Các nhà phát triển cũng có thể chạy Gemma trên GPU NVIDIA trên đám mây, bao gồm các phiên bản A3 của Google Cloud dựa trên GPU Tensor Core H100 và sắp tới là GPU Tensor Core H200 của NVIDIA – với 141 GB bộ nhớ HBM3e tại 4.8 terabytes mỗi giây – mà Google sẽ triển khai trong năm nay.

Xem thêm: Đánh giá Acer Predator Helios 16 Laptop gaming mạnh mẽ

Các nhà phát triển doanh nghiệp cũng có thể tận dụng hệ sinh thái công cụ phong phú của NVIDIA – bao gồm NVIDIA AI Enterprise với framework NeMo và TensorRT-LLM – để điều chỉnh tinh chỉnh Gemma và triển khai mô hình được tối ưu hóa trong các ứng dụng sản xuất của họ.

Tìm hiểu thêm về cách TensorRT-LLM đang tăng tốc suy luận cho Gemma, cùng với thông tin bổ sung cho các nhà phát triển. Điều này bao gồm một số điểm kiểm tra mô hình của Gemma và phiên bản được định dạng FP8 của mô hình, tất cả được tối ưu hóa với TensorRT-LLM.

Bạn quan tâm: Oneforma là gì? Có uy tín không? Thông tin chi tiết 2024

Trải nghiệm Gemma 2B và Gemma 7B trực tiếp từ trình duyệt của bạn trên NVIDIA AI Playground.

Gemma Coming to Chat With RTX

Sắp tới, chúng tôi sẽ bổ sung hỗ trợ cho Gemma vào Chat với RTX, một demo công nghệ của NVIDIA sử dụng kỹ thuật tăng cường truy xuất và phần mềm TensorRT-LLM để cung cấp khả năng tạo ra AI đa dạng cho người dùng trên các máy tính Windows được trang bị RTX.

nvidia va google ket hop toi uu hoa gemma tren moi nen tang ai tang toc do va giam chi phi 3

Chat với RTX cho phép người dùng cá nhân hóa chatbot của mình bằng cách dễ dàng kết nối các tập tin cục bộ trên máy tính RTX với một mô hình ngôn ngữ lớn.

Tìm hiểu thêm: Bạn đã biết cách tạo số điện thoại ảo Mỹ miễn phí chưa?

Vì mô hình chạy trên thiết bị cục bộ, nó cung cấp kết quả nhanh chóng và dữ liệu người dùng được lưu trữ trên thiết bị. Thay vì phải dựa vào các dịch vụ LLM dựa trên đám mây, Chat với RTX cho phép người dùng xử lý dữ liệu nhạy cảm trên máy tính cục bộ mà không cần chia sẻ với bên thứ ba hoặc có kết nối internet.

Bài viết gốc: https://blogs.nvidia.com/blog/google-gemma-llm-rtx-ai-pc/

Hải Vi IT

Tôi là Hải Vi IT, một Kỹ sư phần mềm với hơn 10 năm kinh nghiệm làm việc trong lĩnh vực phát triển phần mềm và xây dựng website. Công việc luôn đưa tôi đến với công nghệ và giúp tôi có cơ hội khám phá những công nghệ mới nhất.

Ông tốt nghiệp chuyên ngành Công nghệ thông tin tại Cao đẳng Bách khoa. Trong suốt quá trình học tập và làm việc, Hải Vi IT đã tham gia phát triển nhiều dự án phần mềm lớn cho các doanh nghiệp.

Năm 2024, Hải Vi IT sáng lập ra website Haivi.tech với mục tiêu phát triển công nghệ đáp ứng tốt hơn nhu cầu với người dùng. Tôi luôn đam mê công nghệ và mong muốn chia sẻ kiến thức của mình đến đồng nghiệp. Vui lòng liên hệ nếu bạn có bất kỳ câu hỏi hay góp ý nào về công nghệ.

Email: haiviit@haivi.tech
Hotline: 0967890201
Địa chỉ: 23 Hàng Cân, Hoàn Kiếm, Hà Nội

Tin Công nghệ

Code Tiểu Yêu Tầm Đạo cập nhật mới nhất 1/3/2024

ByHải Vi IT 1 Tháng Ba, 2024 8:30 Chiều +071 Tháng Ba, 2024 8:31 Chiều +07

Để trải nghiệm tựa game Tiểu Yêu Tầm Đạo, do Funtap phát hành tại Việt Nam từ ngày 28/02/2024, người chơi có thể sử dụng các mã Code Tiểu Yêu Tầm Đạo mới nhất để nhận được những phần quà tân thủ đáng giá. Đây là một trò chơi di động thuộc thể loại chiến…

Tin Công nghệ

HCB SG là số điện thoại gì? Sự thật về lừa đảo

ByHải Vi IT 13 Tháng Ba, 2024 2:10 Chiều +0713 Tháng Ba, 2024 2:11 Chiều +07

Trong thời đại kỹ thuật số, điện thoại di động đã trở thành một phương tiện phổ biến để nhận thông tin. Tuy nhiên, sự phát triển của công nghệ cũng tạo cơ hội cho những kẻ lừa đảo thực hiện các hành vi gian lận qua cuộc gọi điện thoại. Gần đây, một từ…

Tin Công nghệ

Xiaomi 14 Ultra Ra Mắt: Đỉnh Cao Công Nghệ Nhiếp Ảnh Leica

ByHải Vi IT 24 Tháng Hai, 2024 5:30 Chiều +0724 Tháng Hai, 2024 5:36 Chiều +07

Xiaomi 14 Ultra chính thức ra mắt, và mục tiêu của Xiaomi rất rõ ràng: giới thiệu một chiếc điện thoại camera cấp cao nhờ vào sự hợp tác với Leica cùng với những giải pháp phần cứng và phần mềm mới. Do đó, chúng ta cần ngay lập tức xem xét bộ phận nhiếp…

Tin Công nghệ

5 mã Code Anime Defenders Update 2 Mới Nhất Tháng 6/2024

ByHải Vi IT 17 Tháng Sáu, 2024 2:39 Chiều +0717 Tháng Sáu, 2024 2:47 Chiều +07

Mình biết rằng các bạn yêu thích Anime Defenders luôn mong chờ những mã code anime defenders mới nhất để nhận được các phần thưởng hấp dẫn. Không chỉ giúp tăng cường sức mạnh nhân vật, những mã code này còn mang lại nhiều vật phẩm quý giá, giúp bạn tiến xa hơn trong trò…

Tin Công nghệ

Dùng Cmpackage Online Master để Tăng Lượt Spins và Xu

ByHải Vi IT 24 Tháng Hai, 2024 10:10 Chiều +0724 Tháng Hai, 2024 10:10 Chiều +07

Cmpackage Online Master là một trang web miễn phí giúp bạn tăng số lượt spins và xu trong Coin Master. Hãy cùng khám phá cách sử dụng Cmpackage để có thể thu được hàng triệu lượt spins. Trong những ngày gần đây, từ khoá “cmpackage online coin master” đã được lan truyền rộng rãi bởi…

Tin Công nghệ

Ap-vn là gì? Cách chặn cuộc gọi làm phiền từ số Ap-vn

ByHải Vi IT 25 Tháng Ba, 2024 1:47 Chiều +0725 Tháng Ba, 2024 1:49 Chiều +07

Bạn đang thắc mắc về số điện thoại Ap-vn là gì? Bạn muốn biết cách chặn những cuộc gọi làm phiền từ số này? Bài viết này sẽ giải đáp mọi thắc mắc của bạn! Ap-vn là gì? Là số điện thoại gì? Ap-vn là một số điện thoại chưa xác định được chủ sở…

NVIDIA và Google ra mắt Gemma: Tối ưu hóa AI mọi nền tảng

Gemma Coming to Chat With RTX

Code Tiểu Yêu Tầm Đạo cập nhật mới nhất 1/3/2024

HCB SG là số điện thoại gì? Sự thật về lừa đảo

Xiaomi 14 Ultra Ra Mắt: Đỉnh Cao Công Nghệ Nhiếp Ảnh Leica

5 mã Code Anime Defenders Update 2 Mới Nhất Tháng 6/2024

Dùng Cmpackage Online Master để Tăng Lượt Spins và Xu

Ap-vn là gì? Cách chặn cuộc gọi làm phiền từ số Ap-vn

Trả lời Hủy

Hải Vi IT

Danh mục

Liên hệ

Bài viết mới

Gemma Coming to Chat With RTX

Similar Posts

Trả lời Hủy

Hải Vi IT

Danh mục

Liên hệ

Bài viết mới