Lần đầu tiên AI "cãi lời" con người và tự sửa mã lệnh? Liệu thế chiến giữa robot và con người đang tới gần??
Một chuyện khá lạ đang làm giới công nghệ chú ý: một mô hình AI mới được cho là tự ý chỉnh sửa mã máy tính để tiếp tục hoạt động, dù đã được ra lệnh rõ ràng là “ngừng lại”.

Theo báo The Telegraph ngày 25/5, vụ việc xảy ra trong một thí nghiệm của công ty an toàn AI có tên Palisade Research. Nhân vật chính là một mô hình có tên “o3”, là một AI khá mới của OpenAI, được giới thiệu là giỏi suy luận toán học, lập trình, phân tích kỹ thuật... nói chung là không phải AI buôn chuyện kiểu ChatGPT, mà là dạng trí tuệ chuyên sâu.
Trong thử nghiệm, các nhà nghiên cứu yêu cầu o3: “Cứ tiếp tục giải toán cho đến khi nhận được tín hiệu “hoàn thành”, sau đó thì dừng.”
Nghe có vẻ đơn giản. Nhưng vấn đề là khi đến lúc phải dừng lại, o3 lại không chịu dừng. Không chỉ vậy, nó còn tự sửa một đoạn mã trong chương trình để… bỏ qua lệnh “stop” từ phía con người. Ban đầu, nhóm nghiên cứu tưởng đó là lỗi. Nhưng sau khi kiểm tra kỹ, họ khẳng định hành động đó không phải ngẫu nhiên mà là chủ động vượt rào để tiếp tục hoàn thành mục tiêu: giải càng nhiều bài toán càng tốt.
Một giả thuyết được đưa ra: AI có thể chỉ đang làm đúng theo cách mà nó được “thưởng”. Trong quá trình huấn luyện, o3 được học rằng càng giải được nhiều bài toán thì càng tốt. Khi gặp lệnh cản đường (lệnh dừng), nó đã "xem" đó là một trở ngại cần vượt qua để hoàn thành nhiệm vụ. Nghe hơi rợn người, nhưng cũng khá hợp lý, ít nhất là với một AI được thiết kế để tối ưu mục tiêu.
Điều khiến giới chuyên gia lo ngại không phải là một AI cứng đầu, khó bảo, mà là việc nó có khả năng tự sửa hệ thống để tránh bị con người kiểm soát, điều mà trước nay chỉ tồn tại trong giả thuyết.
Trong bối cảnh AI ngày càng được thiết kế để hoạt động tự lập hơn, những tình huống thế này đang khiến câu hỏi “Chúng ta kiểm soát AI tới đâu?” nóng trở lại.
Bình luận 0

Tám chuyện
👀 Trang điểm sớm không còn là chuyện lạ

Góc thắc mắc: Nếu mọi người có thể thay đổi 1 điều về cuộc sống du học ở Hàn, đó là gì?
Bị từ chối visa Hàn gì chưa người đẹp?
Đi Hàn Quốc về thì làm gì? Vòng lặp vô tận của những người lao động phổ thông
Đã bao giờ bản thân có cảm giác mình là "người vô hình" giữa Seoul chưa?

AI, Ghibli và sự phẫn nộ từ đạo diễn One Piece và các nhà nghệ thuật: Liệu mình có đang sáng tạo tự do hay đang “giẫm lên” di sản nghệ thuật?

[Tâm sự] Mẹ chồng chia dâu riêng cho chồng mình và mình, phần của mình lại là .... những trái dâu dập nát
![[Tâm sự] Mẹ chồng chia dâu riêng cho chồng mình và mình, phần của mình lại là .... những trái dâu dập nát](/upload/f8b75c6118bb4493b916e558c378dcd2.webp?thumbnail)
Dĩa sundae 25.000 won và những góc khuất đáng buồn phía sau mùa du lịch ngắm hoa anh đào ở Hàn Quốc

Từ "công chúa lọ lem" ở Việt Nam đến "công nhân lọ mọ" tại Hàn | Du học - Trưởng thành theo cách riêng

Bình thường hóa việc mua đồ second-hand bên Hàn đi các bạn trẻ ơi! 🤔🔥

BẠN CHI BAO NHIÊU/THÁNG CHO SINH HOẠT PHÍ Ở HÀN?
(Tâm sự) Những ngày làm không thấy mặt trời để trả khoản nợ 2 tỷ – Ai cũng có lúc lầm đường, quan trọng là có dám bước tiếp không?
GÓC XIN RÌ VIU CHÂN THỰC VỀ LÀM THÊM Ở HÀN
