Kim chi nha

Lần đầu tiên AI "cãi lời" con người và tự sửa mã lệnh? Liệu thế chiến giữa robot và con người đang tới gần??

1
bngoc_022
2025.05.27 Thích 0 Lượt xem 526 Bình luận 0

Một chuyện khá lạ đang làm giới công nghệ chú ý: một mô hình AI mới được cho là tự ý chỉnh sửa mã máy tính để tiếp tục hoạt động, dù đã được ra lệnh rõ ràng là “ngừng lại”. 

AI in 2025

Theo báo The Telegraph ngày 25/5, vụ việc xảy ra trong một thí nghiệm của công ty an toàn AI có tên Palisade Research. Nhân vật chính là một mô hình có tên “o3”, là một AI khá mới của OpenAI, được giới thiệu là giỏi suy luận toán học, lập trình, phân tích kỹ thuật... nói chung là không phải AI buôn chuyện kiểu ChatGPT, mà là dạng trí tuệ chuyên sâu.

 

Trong thử nghiệm, các nhà nghiên cứu yêu cầu o3: “Cứ tiếp tục giải toán cho đến khi nhận được tín hiệu “hoàn thành”, sau đó thì dừng.”

 

Nghe có vẻ đơn giản. Nhưng vấn đề là khi đến lúc phải dừng lại, o3 lại không chịu dừng. Không chỉ vậy, nó còn tự sửa một đoạn mã trong chương trình để… bỏ qua lệnh “stop” từ phía con người. Ban đầu, nhóm nghiên cứu tưởng đó là lỗi. Nhưng sau khi kiểm tra kỹ, họ khẳng định hành động đó không phải ngẫu nhiên mà là chủ động vượt rào để tiếp tục hoàn thành mục tiêu: giải càng nhiều bài toán càng tốt.

 

Một giả thuyết được đưa ra: AI có thể chỉ đang làm đúng theo cách mà nó được “thưởng”. Trong quá trình huấn luyện, o3 được học rằng càng giải được nhiều bài toán thì càng tốt. Khi gặp lệnh cản đường (lệnh dừng), nó đã "xem" đó là một trở ngại cần vượt qua để hoàn thành nhiệm vụ. Nghe hơi rợn người, nhưng cũng khá hợp lý, ít nhất là với một AI được thiết kế để tối ưu mục tiêu.

 

Điều khiến giới chuyên gia lo ngại không phải là một AI cứng đầu, khó bảo, mà là việc nó có khả năng tự sửa hệ thống để tránh bị con người kiểm soát, điều mà trước nay chỉ tồn tại trong giả thuyết. 

 

Trong bối cảnh AI ngày càng được thiết kế để hoạt động tự lập hơn, những tình huống thế này đang khiến câu hỏi “Chúng ta kiểm soát AI tới đâu?” nóng trở lại.

Bình luận 0

/upload/bf44f8d0ab2947378ce264d6bd29e873.webp

Tám chuyện

Cách săn hàng hiệu giá tốt trên Coupang – Mẹo hay không thể bỏ lỡ!

1
anhnt6
Lượt xem 2877
Thích 0
2025.03.09
Cách săn hàng hiệu giá tốt trên Coupang – Mẹo hay không thể bỏ lỡ!

Người ăn chay có gây hại không? Hay tranh cãi về chủ nghĩa ăn chay mới là điều gây hại?

M
nyanchan
Lượt xem 2980
Thích 0
2025.03.09
Người ăn chay có gây hại không? Hay tranh cãi về chủ nghĩa ăn chay mới là điều gây hại?

Tìm kiếm điều gì ở “nửa kia” để có một tình yêu bền vững?

1
bngoc_022
Lượt xem 2561
Thích 0
2025.03.08
Tìm kiếm điều gì ở “nửa kia” để có một tình yêu bền vững?

Hội Chứng Cinderella Syndrome: Bạn Có Đang Chờ Một "Bạch Mã Hoàng Tử" Cứu Rỗi Cuộc Đời?

1
bngoc_022
Lượt xem 3029
Thích 0
2025.03.08
Hội Chứng Cinderella Syndrome: Bạn Có Đang Chờ Một "Bạch Mã Hoàng Tử" Cứu Rỗi Cuộc Đời?

Cẩm Nang Nhận Diện “Red Flag” Trên App Hẹn Hò Online

1
bngoc_022
Lượt xem 2725
Thích 1
2025.03.08
Cẩm Nang Nhận Diện “Red Flag” Trên App Hẹn Hò Online

Founder của Open AI Sam Altman đến Hàn Quốc nhưng phớt lờ VC Hàn : Cuộc chơi AI có phải không dành cho Hàn Quốc ?

1
haengsin
Lượt xem 2242
Thích 0
2025.03.07
Founder của Open AI Sam Altman đến Hàn Quốc nhưng phớt lờ VC Hàn : Cuộc chơi AI có phải không dành cho Hàn Quốc ?

Mình đã làm tart dâu tây hạt dẻ cười! 🍓💚

M
nyanchan
Lượt xem 3037
Thích 0
2025.03.05
Mình đã làm tart dâu tây hạt dẻ cười! 🍓💚

Một thế giới không cần xem tin tức

M
nyanchan
Lượt xem 2784
Thích 0
2025.03.04
Một thế giới không cần xem tin tức

Những "dấu vết của hiện tại" liệu có trở thành một di sản đáng tự hào, hay chỉ là một vết tích của sự hỗn loạn?

M
nyanchan
Lượt xem 2680
Thích 0
2025.03.04
Những "dấu vết của hiện tại" liệu có trở thành một di sản đáng tự hào, hay chỉ là một vết tích của sự hỗn loạn?

Cảnh sắc đẹp nhất – nơi mọi thứ trở về đúng vị trí của nó

M
nyanchan
Lượt xem 3588
Thích 0
2025.03.04
Cảnh sắc đẹp nhất – nơi mọi thứ trở về đúng vị trí của nó

Phóng viên lên chuyến tàu "Solo Train" để thoát kiếp độc thân – Chuyện gì đã xảy ra trên con tàu tình yêu?

M
nyanchan
Lượt xem 2689
Thích 0
2025.03.04
Phóng viên lên chuyến tàu "Solo Train" để thoát kiếp độc thân – Chuyện gì đã xảy ra trên con tàu tình yêu?

Chỉ ăn một nửa trong nhà hàng thì chỉ trả một nửa tiền?… "Cách tính tiền kỳ lạ của khách hàng"

M
nyanchan
Lượt xem 2843
Thích 0
2025.03.03
Chỉ ăn một nửa trong nhà hàng thì chỉ trả một nửa tiền?… "Cách tính tiền kỳ lạ của khách hàng"

Đến cả con trai nghị sĩ cũng vậy… “Cha mẹ không thể kiểm soát con cái, liệu con tôi cũng như thế?”

M
nyanchan
Lượt xem 2942
Thích 0
2025.03.03
Đến cả con trai nghị sĩ cũng vậy… “Cha mẹ không thể kiểm soát con cái, liệu con tôi cũng như thế?”

Chuyên Gia Tâm Lý Của Tôi Là Một Con Mèo

M
nyanchan
Lượt xem 2232
Thích 0
2025.03.02
Chuyên Gia Tâm Lý Của Tôi Là Một Con Mèo

Đôi khi, chỉ cần có một chút thời gian ở một mình cũng cảm thấy thật tuyệt vời.

M
nyanchan
Lượt xem 2691
Thích 0
2025.03.02
Đôi khi, chỉ cần có một chút thời gian ở một mình cũng cảm thấy thật tuyệt vời.
16 17 18 19 20