Cluely: Trợ lý AI kiểm tra gian lận được định giá 120 triệu USD

Cluely là gì?
Cluely là ứng dụng AI ẩn kín, chạy trên nền trình duyệt và âm thầm theo dõi hoạt động màn hình và âm thanh trên máy tính của người dùng. Không giống như các chatbot truyền thống đòi hỏi người dùng phải chủ động đặt câu hỏi, Cluely liên tục quan sát nội dung hiển thị trên màn hình và lắng nghe âm thanh để đưa ra hỗ trợ phù hợp theo thời gian thực.

Mục tiêu của Cluely là tái định nghĩa cách con người tương tác với công nghệ thông qua một trợ lý "vô hình", giúp nâng cao năng suất và hiệu suất trong nhiều ngữ cảnh như họp hành, bán hàng hoặc tác vụ cá nhân.
Tại thời điểm viết bài, Cluely chưa tiết lộ thông tin tokenomics. Bài viết sẽ cập nhật sau khi có thông báo.
Một số tính năng của Cluely
Cluely được thiết kế để trở thành một trợ lý AI toàn năng, hỗ trợ người dùng trong nhiều tình huống thực tế nhờ khả năng xử lý âm thanh và hình ảnh theo thời gian thực. Không chỉ phản hồi theo yêu cầu, Cluely còn tự động quan sát ngữ cảnh, từ đó cung cấp sự trợ giúp chính xác mà không làm gián đoạn trải nghiệm người dùng.

Một số tính năng chính bao gồm:
- Hỗ trợ trong cuộc họp: Cluely có thể lắng nghe nội dung hội thoại, ghi nhớ các đoạn trước đó, và cung cấp phản hồi theo thời gian thực, giúp người dùng theo kịp cuộc trò chuyện hoặc không bỏ sót thông tin quan trọng.
- Hỗ trợ bán hàng: Cluely hỗ trợ các nhân viên bán hàng, đặc biệt là những người không chuyên kỹ thuật, bằng cách đọc các tài liệu như brief, one-pager hoặc PDF để trích xuất thông tin phù hợp, xử lý phản đối, và cung cấp dữ liệu sản phẩm kịp thời khi cần thiết.
- Hỗ trợ cá nhân hóa công việc: Cluely có thể đọc màn hình và hỗ trợ các tác vụ cá nhân như học tập, gỡ lỗi, viết nội dung hoặc nghiên cứu - tất cả đều dựa trên bối cảnh hiển thị thực tế, giúp người dùng làm việc nhanh và hiệu quả hơn.
- Thiết kế kín đáo, không thể phát hiện: Cluely được tối ưu để ẩn hoàn toàn trong các buổi chia sẻ màn hình, ghi âm, hay họp trực tuyến. Giao diện nhỏ gọn có thể di chuyển, không gây phân tán, đảm bảo tính riêng tư và sự kín đáo tuyệt đối.
Kiến trúc mô hình của Cluely
Cluely vận hành trên kiến trúc AI đa mô thức (multimodal), kết hợp đồng thời hai kênh đầu vào là âm thanh (audio)và hình ảnh hiển thị trên màn hình (visual context) để đưa ra phản hồi thời gian thực.
Thay vì hoạt động theo lối tương tác truyền thống, yêu cầu đầu vào văn bản hoặc lệnh thoại: Cluely duy trì trạng thái "nghe – nhìn – hiểu" liên tục trong môi trường làm việc của người dùng, từ đó xây dựng mô hình ngữ cảnh sống (live contextual model).
Cốt lõi công nghệ bao gồm ba thành phần:
- Speech recognition & live conversation trackingHệ thống có khả năng nhận diện, phân tách và xử lý âm thanh từ các cuộc họp, hội thoại trực tiếp (gồm cả tiếng nói người dùng và người đối thoại), đồng thời duy trì mô hình hội thoại mở rộng theo chiều dài thời gian. Điều này cho phép Cluely không chỉ phản hồi tức thì, mà còn tham chiếu ngược lại các điểm đã đề cập trước đó để tăng tính liền mạch và chính xác của phản hồi.
- On-screen content interpretationKhác với các trợ lý dựa trên văn bản truyền thống, Cluely khai thác bối cảnh thị giác bằng cách "đọc" nội dung trên màn hình – từ đoạn mã, tài liệu PDF, đến các giao diện sản phẩm SaaS, để hiểu ngữ cảnh tác vụ. Điều này giúp mô hình đưa ra phản hồi không dựa trên câu lệnh, mà dựa trên trạng thái làm việc thực tế của người dùng.
- Real-time multimodal reasoning: Cluely sử dụng kỹ thuật suy luận tức thì (real-time inference) để đưa ra phản hồi mà không gây gián đoạn.
Một điểm nổi bật là khả năng tương tác "ẩn danh" trong môi trường chia sẻ màn hình, họp video hoặc ghi âm - một thách thức lớn về cả mặt kỹ thuật (tối ưu UI) lẫn quyền riêng tư. Cluely giải quyết điều này thông qua giao diện bán trong suốt, có thể di chuyển linh hoạt, hoạt động dưới dạng một lớp “cùng tầng” (co-layered UI) với phần mềm chính.
Một số tranh cãi xoay quanh Cluely
Mặc dù tính ứng dụng có vẻ khả thi nhưng Cluely đặt ra nhiều vấn đề đáng lo ngại về đạo đức và quyền riêng tư trong quá trình sử dụng.
Trước hết, nhiều nhà phân tích cho rằng ứng dụng này được thiết kế để hỗ trợ gian lận có chủ đích, điển hình là trong các buổi phỏng vấn kỹ thuật, nơi người dùng có thể nhận được câu trả lời trực tiếp từ AI mà không để đối phương biết, gây ảnh hưởng nghiêm trọng đến tính minh bạch và công bằng.
Thứ hai, Cluely hoạt động một cách âm thầm: theo dõi màn hình, ghi nhận âm thanh và đưa ra phản hồi mà không cảnh báo cho các bên tham gia khác, vi phạm nguyên tắc cơ bản về quyền riêng tư và sự đồng thuận.
Ngoài ra, việc nhà sáng lập so sánh Cluely với Google hay máy tính bỏ túi là không chính xác về bản chất - trong khi các công cụ truyền thống minh bạch và giới hạn trong bối cảnh sử dụng rõ ràng, Cluely lại giả mạo người dùng đang tự trả lời, che giấu hoàn toàn sự hiện diện của AI.
Đội ngũ và nhà đầu tư Cluely
Startup đứng sau phát triển Cluely được thành lập bởi Roy Lee và Neel Shanmugam. Tuy nhiên, câu chuyện đằng sau của hai nhà sáng lập cũng đặt ra nhiều câu hỏi khi cả hai đều từng bị đình chỉ tại Đại học Columbia vì phát triển một công cụ AI hỗ trợ gian lận trong phỏng vấn kỹ thuật, được gọi là "Interview Coder."
Về phía nhà đầu tư, Cluely đã huy động được 5.3 triệu USD trong vòng gọi vốn seed và 15 triệu USD trong vòng Series A do a16z dẫn dắt, định giá công ty khoảng 120 triệu USD. Một số nhà đầu tư khác bao gồm Abstract Ventures và Susa Ventures.