OpenAI là công ty nghiên cứu và triển khai trí tuệ nhân tạo nổi tiếng với những công cụ AI được cả thế giới quan tâm như ChatGPT, DALL-E, Point-E, v.v. Mới đây OpenAI tiếp tục ra mắt Shap-E, một mô hình AI sáng tạo mới. Vậy công cụ này có thể làm được những gì, hãy cùng khám phá nhé!
Shap-E là gì?
Vào tháng 5 năm 2023, Alex Nichol và Heewon Jun là các nhà nghiên cứu kiêm cộng tác viên của OpenAI đã công bố một bài báo giới thiệu về Shap-E. Đây là sản phẩm trí tuệ nhân tạo mới nhất của công ty được huấn luyện bằng một bộ dữ liệu khổng lồ gồm các hình ảnh 3D và văn bản được liên kết với nhau, giúp AI có khả năng tạo mô hình 3D từ văn bản hoặc hình ảnh. Nếu như DALL-E có thể tạo hình ảnh 2D từ văn bản thì Shap-E tạo ra mô hình 3D.
Shap-E được huấn luyện về kỹ thuật mô hình khuếch tán có điều kiện và ánh xạ nội dung 3D. Ánh xạ nội dung 3D có nghĩa là liên kết văn bản hoặc hình ảnh với các mô hình 3D tương ứng dựa trên dữ liệu lớn của các đối tượng 3D có sẵn. Mô hình khuếch tán có điều kiện là mô hình được tạo ra ban đầu dưới dạng hình ảnh khái quát và mơ hồ, sau đó dần dần chỉnh sửa bằng cách loại bỏ các phần thừa và bổ sung thêm chi tiết rõ ràng.
Bằng cách kết hợp hai thành phần này, Shap-E có thể tạo ra các mô hình 3D thực tế và đa dạng phù hợp với văn bản hoặc hình ảnh, hơn nữa còn có thể thay đổi góc nhìn và điều kiện ánh sáng khác nhau.
Cách sử dụng Shap-E như thế nào?
Hiện tại Shap-E chưa được ra mắt chính thức như các công cụ khác của OpenAI, nhưng người dùng có thể tải các yếu tố của nó như trọng lượng mô hình, mã suy luận và các hình mẫu trên trang GitHub của Shap-E.
Bạn có thể download mã của Shap-E miễn phí và cài đặt nó bằng lệnh Python pip trên máy tính, lưu ý rằng máy tính phải có GPU NVIDIA và CPU hiệu suất cao vì Shap-E rất tốn tài nguyên.
Sau khi cài đặt, hãy mở hình ảnh 3D mà bạn đã tạo trên Paint 3D của Microsoft. Cũng có thể chuyển đổi hình ảnh thành file STL nếu muốn in ra bằng máy in 3D.
Trên trang GitHub của Shap-E cũng có tính năng cho phép người dùng báo cáo sự cố và tìm giải pháp cho các sự cố đã được những người khác nêu ra.
Shap-E có ứng dụng gì trong thực tế?
Công cụ mới này cho phép bạn mô tả các ý tưởng phức tạp bằng cách sử dụng hình ảnh trực quan của ý tưởng đó. Tiềm năng ứng dụng của nó trong thực tế là rất lớn vì hình ảnh thường có tác động hiệu quả và sâu rộng hơn nhiều so với chữ viết.
Những người làm kiến trúc có thể sử dụng Shap-E để tạo mô hình 3D của các tòa nhà và công trình dựa trên mô tả bằng văn bản. Bạn có thể chỉ định kích thước, vật liệu, màu sắc và kiểu dáng của công trình bằng các câu lệnh đơn giản, ví dụ như đưa ra yêu cầu “Tạo tòa nhà chọc trời có 60 tầng và lan can bằng kính”, sau đó có thể xuất hình ảnh kết quả sang phần mềm khác để chỉnh sửa thêm nếu cần thiết.
Các game thủ và họa sĩ hoạt hình có thể thiết kế môi trường ảo và trải nghiệm hình ảnh tốt hơn bằng cách yêu cầu Shap-E tạo ra các vật thể và nhân vật 3D chi tiết. Trong khi đó các kỹ sư có thể mô tả các yếu tố của máy móc thiết bị như các bộ phận, thông số kỹ thuật và chức năng cho Shap-E để tạo mô hình 3D trước khi làm ra sản phẩm thực tế.
Ngay cả trong các lĩnh vực đặc thù như giáo dục, Shap-E cũng có thể giúp giáo viên truyền đạt những ý tưởng phức tạp và trừu tượng cho học sinh trong các môn như sinh học, hình học và vật lý.
Mặc dù vẫn đang trong quá trình hoàn thiện nhưng Shap-E đã đi trước một bước so với POINT-E của OpenAI – công cụ tạo ra các điểm 3D từ mô tả bằng văn bản. Các điểm này bị hạn chế về khả năng diễn đạt và độ phân giải, thường tạo ra các hình mờ hoặc không hoàn chỉnh.
Tóm lại
Shap-E là minh chứng ấn tượng về sức mạnh của AI trong việc tạo hình ảnh 3D từ ngôn ngữ tự nhiên hoặc hình ảnh. Với công cụ này, bạn có thể tạo các đối tượng 3D cho game trên máy tính, trải nghiệm VR tương tác, tạo nguyên mẫu vật thể và nhiều mục đích khác trong thực tế. Mặc dù chưa thể đảm bảo về chất lượng sản phẩm được tạo ra nhưng Shap-E là một giải pháp nhanh chóng và hiệu quả để tạo mô hình 3D của mọi thứ. Bên cạnh đó, công cụ AI này có đóng góp quan trọng đối với lĩnh vực học sâu và có thể tạo tiền đề dẫn đến những đổi mới sáng tạo khác trong tương lai.
Mời bạn xem thêm các bài viết liên quan:
- Sự kiện Google I/O 2023: Trí tuệ nhân tạo là tâm điểm bên cạnh các thiết bị Pixel
- 8 đổi mới hấp dẫn về trí tuệ nhân tạo Bard được Google công bố tại I/O 2023
Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!
source https://bloganchoi.com/shap-e-cong-cu-tri-tue-nhan-tao-moi-cua-openai/
Không có nhận xét nào:
Đăng nhận xét