Kim chi nha

Lần đầu tiên AI "cãi lời" con người và tự sửa mã lệnh? Liệu thế chiến giữa robot và con người đang tới gần??

1
bngoc_022
2025.05.27 Thích 0 Lượt xem 677 Bình luận 0

Một chuyện khá lạ đang làm giới công nghệ chú ý: một mô hình AI mới được cho là tự ý chỉnh sửa mã máy tính để tiếp tục hoạt động, dù đã được ra lệnh rõ ràng là “ngừng lại”. 

AI in 2025

Theo báo The Telegraph ngày 25/5, vụ việc xảy ra trong một thí nghiệm của công ty an toàn AI có tên Palisade Research. Nhân vật chính là một mô hình có tên “o3”, là một AI khá mới của OpenAI, được giới thiệu là giỏi suy luận toán học, lập trình, phân tích kỹ thuật... nói chung là không phải AI buôn chuyện kiểu ChatGPT, mà là dạng trí tuệ chuyên sâu.

 

Trong thử nghiệm, các nhà nghiên cứu yêu cầu o3: “Cứ tiếp tục giải toán cho đến khi nhận được tín hiệu “hoàn thành”, sau đó thì dừng.”

 

Nghe có vẻ đơn giản. Nhưng vấn đề là khi đến lúc phải dừng lại, o3 lại không chịu dừng. Không chỉ vậy, nó còn tự sửa một đoạn mã trong chương trình để… bỏ qua lệnh “stop” từ phía con người. Ban đầu, nhóm nghiên cứu tưởng đó là lỗi. Nhưng sau khi kiểm tra kỹ, họ khẳng định hành động đó không phải ngẫu nhiên mà là chủ động vượt rào để tiếp tục hoàn thành mục tiêu: giải càng nhiều bài toán càng tốt.

 

Một giả thuyết được đưa ra: AI có thể chỉ đang làm đúng theo cách mà nó được “thưởng”. Trong quá trình huấn luyện, o3 được học rằng càng giải được nhiều bài toán thì càng tốt. Khi gặp lệnh cản đường (lệnh dừng), nó đã "xem" đó là một trở ngại cần vượt qua để hoàn thành nhiệm vụ. Nghe hơi rợn người, nhưng cũng khá hợp lý, ít nhất là với một AI được thiết kế để tối ưu mục tiêu.

 

Điều khiến giới chuyên gia lo ngại không phải là một AI cứng đầu, khó bảo, mà là việc nó có khả năng tự sửa hệ thống để tránh bị con người kiểm soát, điều mà trước nay chỉ tồn tại trong giả thuyết. 

 

Trong bối cảnh AI ngày càng được thiết kế để hoạt động tự lập hơn, những tình huống thế này đang khiến câu hỏi “Chúng ta kiểm soát AI tới đâu?” nóng trở lại.

Bình luận 0

/upload/bf44f8d0ab2947378ce264d6bd29e873.webp

Tám chuyện

Gian lận để Thành công

M
nyanchan
Lượt xem 2477
Thích 0
2025.02.21
Gian lận để Thành công

[ANIME] Luận đề của một thiên thần nhân từ: Evangelion và khải huyền

M
nyanchan
Lượt xem 2995
Thích 0
2025.02.21
[ANIME] Luận đề của một thiên thần nhân từ: Evangelion và khải huyền

Điều cần cân nhắc khi lập kế hoạch mang thai

M
nyanchan
Lượt xem 2401
Thích 0
2025.02.21
Điều cần cân nhắc khi lập kế hoạch mang thai

"Màu sắc không chỉ là thứ chúng ta nhìn thấy."

M
nyanchan
Lượt xem 2209
Thích 0
2025.02.20
"Màu sắc không chỉ là thứ chúng ta nhìn thấy."

"Thời tiết trong trái tim ta thuộc về ta, và chỉ riêng ta mà thôi." - Tiệm Giặt Tâm Trí Cúc Vạn Thọ

M
nyanchan
Lượt xem 2385
Thích 0
2025.02.20
"Thời tiết trong trái tim ta thuộc về ta, và chỉ riêng ta mà thôi." - Tiệm Giặt Tâm Trí Cúc Vạn Thọ

Tiểu thuyết "Cái Hố" tập trung vào khắc họa nhân vật nhưng vẫn mang sự hồi hộp của một tác phẩm trinh thám

+1
M
nyanchan
Lượt xem 3090
Thích 0
2025.02.19
Tiểu thuyết "Cái Hố" tập trung vào khắc họa nhân vật nhưng vẫn mang sự hồi hộp của một tác phẩm trinh thám

Review sách: "Chào mừng đến với Cửa Hàng Sách Hyunam-dong" của Hwang Bo-reum

M
nyanchan
Lượt xem 3018
Thích 0
2025.02.18
Review sách: "Chào mừng đến với Cửa Hàng Sách Hyunam-dong" của Hwang Bo-reum

Dầu hạt dẻo đang trở thành xu hướng trong mì pasta và makguksu.

M
nyanchan
Lượt xem 2767
Thích 0
2025.02.18
Dầu hạt dẻo đang trở thành xu hướng trong mì pasta và makguksu.

Người Hàn Quốc làm mọi việc rất nhanh. Đó là sự hiệu quả hay thiếu kiên nhẫn?

M
nyanchan
Lượt xem 2360
Thích 0
2025.02.18
Người Hàn Quốc làm mọi việc rất nhanh. Đó là sự hiệu quả hay thiếu kiên nhẫn?

Những tác động của việc làm việc dưới một ông chủ hoặc quản lý tồi là gì? Bạn có thể làm gì nếu phải ở lại với họ vì lý do tiền bạc hoặc tình hình kinh tế?

M
nyanchan
Lượt xem 2090
Thích 0
2025.02.18
Những tác động của việc làm việc dưới một ông chủ hoặc quản lý tồi là gì? Bạn có thể làm gì nếu phải ở lại với họ vì lý do tiền bạc hoặc tình hình kinh tế?

Dưới đây là 10 bài học từ cuốn sách The Courage to Be Disliked của Ichiro Kishimi và Fumitake Koga:

M
nyanchan
Lượt xem 2491
Thích 0
2025.02.17
Dưới đây là 10 bài học từ cuốn sách The Courage to Be Disliked của Ichiro Kishimi và Fumitake Koga:

Sách giáo khoa AI trong lớp học: Kịp thời hay quá sớm?

M
nyanchan
Lượt xem 2426
Thích 0
2025.02.17
Sách giáo khoa AI trong lớp học: Kịp thời hay quá sớm?

Giá bữa trưa tăng nhanh, nhưng lương không theo kịp

M
nyanchan
Lượt xem 2807
Thích 0
2025.02.17
Giá bữa trưa tăng nhanh, nhưng lương không theo kịp

Ngừng lướt, bắt đầu trò chuyện thôi!

M
nyanchan
Lượt xem 2831
Thích 0
2025.02.17
Ngừng lướt, bắt đầu trò chuyện thôi!

REVIEW SÁCH: TÔI MUỐN CHẾT NHƯNG TÔI MUỐN ĂN TTEOKBOKKI (2022) CỦA BAEK SEHEE – MỘT NHÀ VĂN HÀN QUỐC VỚI SỰ KHẮC HỌA CHÂN THỰC VỀ SỨC KHỎE TÂM LÝ

M
nyanchan
Lượt xem 2884
Thích 0
2025.02.16
REVIEW SÁCH: TÔI MUỐN CHẾT NHƯNG TÔI MUỐN ĂN TTEOKBOKKI (2022) CỦA BAEK SEHEE – MỘT NHÀ VĂN HÀN QUỐC VỚI SỰ KHẮC HỌA CHÂN THỰC VỀ SỨC KHỎE TÂM LÝ
19 20 21 22 23