Image default
Máy Tính

Google Gemini vs. NotebookLM: So sánh Audio Overviews – AI nào tối ưu?

Trong thế giới công nghệ AI đang phát triển không ngừng, việc tiếp cận và tổng hợp thông tin đã trở nên dễ dàng hơn bao giờ hết nhờ các công cụ trợ lý nghiên cứu thông minh. Nổi bật trong số đó là tính năng Audio Overviews của Google, một đột phá giúp chuyển đổi các tài liệu và báo cáo nghiên cứu chuyên sâu thành định dạng podcast hấp dẫn. Ban đầu được ra mắt dưới dạng thử nghiệm trong NotebookLM, tính năng này sau đó đã mở rộng sang Gemini, mang lại những trải nghiệm độc đáo và tiện lợi.

Audio Overviews ra đời từ tháng 9 năm 2024 trong khuôn khổ dự án thử nghiệm của NotebookLM, tận dụng sức mạnh của Gemini 1.5 Pro để biến nguồn tài liệu của bạn thành một buổi thảo luận podcast do hai “host” ảo dẫn dắt. Chúng không chỉ cung cấp thông tin mà còn mang sắc thái dí dỏm, hài hước, giúp biến những chủ đề khô khan nhất trở nên thú vị hơn. Dù ban đầu bị giới hạn trong NotebookLM, đến tháng 3 năm 2025, Google đã chính thức tích hợp Audio Overviews vào giao diện của Gemini, mở ra nhiều khả năng mới mẻ. Cá nhân tôi đã gắn bó với NotebookLM từ những ngày đầu và thường xuyên sử dụng Audio Overviews tại đây. Gần đây, khi trải nghiệm tính năng này trong Gemini, tôi đã bất ngờ nhận thấy nó nâng tầm trải nghiệm nghe hiểu lên một cấp độ mới.

Giao diện đăng ký và trang chủ của Google NotebookLM trên iPad, minh họa quy trình bắt đầu sử dụng trợ lý nghiên cứu AI.Giao diện đăng ký và trang chủ của Google NotebookLM trên iPad, minh họa quy trình bắt đầu sử dụng trợ lý nghiên cứu AI.

Audio Overviews của Gemini: Tương đồng về cốt lõi, khác biệt về trải nghiệm

Về cơ bản, tính năng Audio Overviews trong cả NotebookLM và Gemini đều có cùng một mục đích: sử dụng sức mạnh của Gemini để tạo ra các bản tóm tắt âm thanh theo phong cách podcast với hai người dẫn chương trình AI. Tuy nhiên, trải nghiệm sử dụng tính năng này trên Gemini lại có một chút khác biệt và ở một số khía cạnh, thậm chí còn tốt hơn.

Để sử dụng bất kỳ tính năng nào trong NotebookLM, bạn cần tạo một “sổ ghi chép” (notebook) và thêm các nguồn tài liệu vào đó. Sau khi hoàn tất, bạn chỉ cần nhấn nút “Generate” dưới mục “Audio Overview” để tạo một bản podcast AI từ các nguồn đã cung cấp. Về cơ bản, đó là tất cả những gì bạn có thể làm với Audio Overviews trong NotebookLM – các bản podcast chỉ được tạo ra dựa trên chính xác những tài liệu bạn đã tải lên.

Màn hình làm việc của NotebookLM trên laptop, hiển thị các tài liệu nguồn và tùy chọn tạo Audio Overview AI từ các tệp đã tải lên.Màn hình làm việc của NotebookLM trên laptop, hiển thị các tài liệu nguồn và tùy chọn tạo Audio Overview AI từ các tệp đã tải lên.

Gemini đã nâng cấp khả năng này lên một tầm cao mới. Ngoài việc có thể chuyển đổi các tài liệu bạn tải lên thành tóm tắt âm thanh, Audio Overviews của Gemini còn có thể biến các báo cáo “Deep Research” (Nghiên cứu Chuyên sâu) thành các buổi thảo luận âm thanh theo phong cách podcast. Điều này có nghĩa là Audio Overviews của Gemini không chỉ giới hạn ở các nguồn bạn cung cấp. Mặc dù điều này có thể làm tăng khả năng “ảo giác” (hallucination) của AI so với NotebookLM, nhưng sự linh hoạt bổ sung này mang lại giá trị đáng kể, đặc biệt khi bạn muốn có một cái nhìn tổng quan rộng hơn về một chủ đề, vượt ra ngoài phạm vi tài liệu cá nhân.

Tôi cũng nhận thấy rằng các bản Audio Overviews của Gemini thường ngắn hơn đáng kể so với những gì bạn nhận được từ NotebookLM, ngay cả khi sử dụng cùng một nguồn tài liệu. Do đó, tôi thường dùng Audio Overviews của Gemini khi cần một bản tóm tắt nhanh gọn, còn NotebookLM khi muốn một cái nhìn chuyên sâu và dài hơn.

Ưu thế vượt trội của Gemini: Chuyển đổi báo cáo Deep Research thành Audio Overviews

Điều thực sự hấp dẫn tôi khi chuyển sang dùng Audio Overviews trong Gemini chính là khả năng tích hợp của nó với tính năng Deep Research. Nếu bạn chưa từng sử dụng Deep Research của Gemini, đây là tính năng thực hiện chính xác như tên gọi của nó. Bạn cung cấp cho Gemini thông tin chi tiết về một chủ đề mà bạn muốn nghiên cứu, sau đó AI này sẽ tự động lập kế hoạch nghiên cứu, phân tích kết quả và tạo ra một báo cáo toàn diện.

Ví dụ, trong một trường hợp cụ thể, tôi đã yêu cầu Gemini sử dụng Deep Research để thực hiện nghiên cứu về XDA. Nó đã đưa ra một kế hoạch gồm 8 bước, bắt đầu từ việc nghiên cứu lịch sử hình thành và sứ mệnh của trang web, và kết thúc bằng mức độ liên quan hiện tại của XDA. Deep Research đánh giá hàng chục trang web, bao gồm cả các diễn đàn cộng đồng như Reddit, điều này thực sự giúp AI phác họa một bức tranh toàn diện về chủ đề. Trong quá trình nghiên cứu, Gemini thậm chí còn hiển thị toàn bộ quá trình tư duy, phương pháp nghiên cứu đang áp dụng và các nguồn thông tin mà nó đang thu thập. Chẳng hạn, trong trường hợp này, nó đã nghiên cứu 104 trang web, bao gồm Reddit, MuckRack, YouTube và nhiều nguồn khác.

Minh họa khái niệm năng suất được cải thiện nhờ ứng dụng công nghệ trí tuệ nhân tạo (AI), đặc biệt là trong các tác vụ nghiên cứu chuyên sâu.Minh họa khái niệm năng suất được cải thiện nhờ ứng dụng công nghệ trí tuệ nhân tạo (AI), đặc biệt là trong các tác vụ nghiên cứu chuyên sâu.

Tuy nhiên, vấn đề là các báo cáo mà Deep Research tạo ra thực sự rất “chuyên sâu” và dài. Báo cáo cuối cùng mà Gemini tạo ra trong ví dụ này dài tới mười chín trang! Đó chính là lúc Audio Overviews của Gemini phát huy tác dụng. Thay vì phải đọc hàng chục trang văn bản, bạn có thể chuyển đổi báo cáo đó thành một bản podcast ngay trong Gemini.

Trước khi Google thêm Audio Overviews vào giao diện Gemini, tôi phải tải xuống báo cáo Deep Research, tạo một sổ ghi chép mới trong NotebookLM, tải báo cáo lên làm nguồn, và sau đó mới tạo Audio Overview. Giờ đây, với Audio Overviews được tích hợp trực tiếp vào Gemini, sự phiền phức đó đã biến mất. Sau khi báo cáo của bạn được tạo, tất cả những gì bạn cần làm là nhấp vào nút “Create” và chọn “Audio Overview” từ menu thả xuống. Tôi đã áp dụng phương pháp này khi muốn mở rộng nghiên cứu ngoài các nguồn tài liệu cá nhân, không bị giới hạn bởi những gì đã tải lên sổ ghi chép của mình.

Hạn chế của Audio Overviews trong Gemini so với NotebookLM

Mặc dù tôi đã thấy Audio Overviews của NotebookLM rất ấn tượng, nên ngay cả trước khi thử phiên bản của Gemini, tôi biết mình sẽ không thất vọng. Việc tích hợp với tính năng Deep Research và khả năng tạo Audio Overviews từ các nguồn tải lên như NotebookLM đã làm nó trở nên hấp dẫn hơn. Nhưng điều đó không có nghĩa là Gemini’s Audio Overviews tốt hơn ngay lập tức. Tính năng này trong Gemini vẫn còn thiếu nhiều điểm mà NotebookLM đã có.

Chẳng hạn, bạn có thể sử dụng chế độ tương tác (interactive mode) trong NotebookLM để tham gia vào podcast, đặt câu hỏi hoặc chia sẻ ý kiến của mình, điều này cực kỳ hữu ích cho việc học tập. Trong khi đó, tính năng của Gemini hiện tại chỉ là trải nghiệm nghe một chiều. Ngoài ra, như đã đề cập ở trên, các bản Audio Overviews của Gemini thường ngắn hơn đáng kể so với NotebookLM.

Giao diện tương tác của Audio Overview trong Google NotebookLM, hiển thị tùy chọn "Join" để người dùng tham gia và đặt câu hỏi cho podcast AI.Giao diện tương tác của Audio Overview trong Google NotebookLM, hiển thị tùy chọn "Join" để người dùng tham gia và đặt câu hỏi cho podcast AI.

NotebookLM thậm chí còn cho phép bạn chọn giữa các bản Audio Overviews ngắn hơn và dài hơn, nhưng Gemini lại không cung cấp bất kỳ quyền kiểm soát nào đối với độ dài của âm thanh. Ví dụ, bản Audio Overview mà Gemini tạo ra từ báo cáo Deep Research dài 19 trang chỉ có thời lượng 6 phút.

Nếu bạn đã và đang sử dụng Audio Overviews của NotebookLM nhưng chưa thử qua Gemini, nghĩ rằng chúng giống nhau (như tôi đã từng nghĩ trong một thời gian dài), bạn đang bỏ lỡ rất nhiều điều, đặc biệt là khi nói đến tính năng Deep Research. Gemini mang lại một cấp độ tiện lợi và khả năng tóm tắt báo cáo chuyên sâu mà NotebookLM chưa có được. Hãy tự mình trải nghiệm để khám phá đâu là trợ thủ AI nghiên cứu tối ưu nhất cho nhu cầu của bạn!

Hãy chia sẻ trải nghiệm của bạn về các tính năng Audio Overviews của Google Gemini và NotebookLM trong phần bình luận bên dưới!

Related posts

Khám Phá 4 Tính Năng Ít Biết Của Microsoft PowerToys Giúp Tăng Tốc Năng Suất Làm Việc

Administrator

Phá Bỏ 10 Lầm Tưởng Phổ Biến Về Mật Khẩu: Nâng Cấp Bảo Mật Cho Tài Khoản Trực Tuyến

Administrator

Khám phá Các Công Cụ Tự Động Hóa Hàng Đầu Trên Windows Để Tối Ưu Năng Suất Làm Việc

Administrator