Nếu bạn đã nghe về sự kiện mới nhất của AIphaGo vào tuần trước - nghiền nát tuyển thủ cờ vây xuất sắc nhất thế giới và được thừa nhận rằng trí tuệ nhân tạo đã trở nên tinh thông nghệ thuật chơi cờ cổ đại của Trung Quốc - ắt hẳn bạn chỉ đang nghe về sự kiện này theo một cách phóng đại quá mức.

Sự thất bại của thần đồng cờ vây 19 tuổi người Trung Quốc Ke Jie trước AlphaGo là không thể chối cãi, làm rung động toàn thể cộng đồng cờ vây toàn thế giới nói riêng và nhân loại nói chung. Hình ảnh Ke Jie gục đầu chán chường bên bàn cờ vây, vò đầu bứt tóc một cách bất lực in sâu vào tiềm thức một cách ám ảnh của người xem lúc ấy.

Tuy nhiên, chúng ta chỉ tập trung vào sự việc ấy mà đã bỏ qua nhiều vấn đề. DeepMind, một công ty sở hữu bởi Google phát triển AlphaGo không nhằm mục đích đè bẹp loài người, dù sao thì, đó là một công ty vận hành bởi chính con người. AIphaGo đại diện cho những thành tựu nổi bật của nhân loại, AI không nhằm vượt qua hay chống đối loài người, mà giúp chúng ta phát triển hơn.

Tôi đã có một vài cuộc đối thoại với DeepMind và những lập trình viên của Google tại hội nghị cấp cao Tương lai của cờ vây ở Ô Trấn, tỉnh Chiết Giang, Trung Quốc vào tuần trước, những gì họ đề cập tới là về trận thắng báo thù của Lee Se-dol chứ không phải 4 trận bại trước AlphaGo vào năm ngoái.

Loai nguoi hay tien len sau tran thua AlphaGo hinh anh 2

“Lee Se-dol khai thác triệt để điểm yếu của AIphaGo trong ván thứ tư, đó chính là lỗ hổng về kiến thức, khuyết điểm lớn nhất của AIphaGo. Chúng tôi đã làm việc cật lực để sữa chữa khuyết điểm ấy và lấp đi lỗ trống kiến thức bằng cách dạy hoặc để AIphaGo tự học hỏi những nước đi mới. Tuy nhiên, chúng tôi vẫn chưa thể thử nghiệm liệu AIphaGo có thể tốt lên hay không, cho tới khi nó đánh bại một cao thủ như Ke Jie”, đồng sáng lập DeepMind kiêm CEO Demis Hassabis chia sẻ.

Mọi chuyện xảy ra thật bất ngờ, AIphaGo áp đảo Ke với tỷ số 3-0 đồng nghĩa với việc lỗ hổng kiến thức đã được lấp đầy. Nhờ thất bại của AIphaGo với Lee, DeepMind học hỏi từ sai sót ấy và không ngừng cải tiến, nếu không thì Ke có lẽ đã chiến thắng, bởi vì tuyển thủ mạnh hơn Lee gấp nhiều lần. Hơn nữa, AIphaGo không có khả năng tự mãn.

Loai nguoi hay tien len sau tran thua AlphaGo hinh anh 3

Phiên bản AIphaGo đã thi đấu với Ke vốn được lập trình lại - Deepmind đặt tên nó là AIphaGo Master. Nó thông minh hơn phiên bản AlphaGo năm ngoái từng đấu với Lee Se-dol. 

“Cải tiến quan trọng nhất của AIphaGo chính là khả năng tự dạy bản thân. AIphaGo giờ đây tự nó tìm kiếm những thông tin cần thiết và học chúng để nâng cấp mạng lưới neuron, chúng tôi cho rằng kiến thức của AIphaGo hiện nay là rất toàn diện. Một trong những điều chúng tôi mong mỏi hiện nay là không những AIphaGo sẽ chơi cờ vây tốt hơn, mà nó sẽ trở thành đầu tàu công nghệ chính ở nhiều lĩnh vực đầy thách thức khác,” Dave Silver, nhà nghiên cứu chính của DeepMind nhận xét.

AIphaGo gồm có hai mạng lưới: Một định hình thông tin giúp lựa chọn nước đi tiếp theo, một truy xuất giá trị dùng để phân tích những khả năng dẫn đến chiến thắng. Mạng lưới thông tin này được lập trình dựa trên hàng triệu nước cờ vây của những tuyển thủ chuyên nghiệp. Nhưng, AIphaGo Master lại tiến xa hơn bằng cách tìm kiếm những khả năng có thể xảy ra khi một nước đi được thực hiện, gia tăng hiểu biết của chính nó về những nước đi sai lầm tiềm tàng.

Loai nguoi hay tien len sau tran thua AlphaGo hinh anh 4

“Chương trình AIphaGo gốc tự chơi với chính nó hàng triệu lần, nhưng lại không có khả năng tự tìm kiếm nước đi. Còn AIphaGo Master sử dụng chính sức mạnh của mình để dự đoán nước đi tiếp theo. Trong khi phiên bản tiền nhiệm chỉ có thể xử lý thông tin hữu hiệu, thì bản nâng cấp tự mình sử dụng mạng lưới thông tin để cải thiện từng chút một”, Hassabis trả lời The Verge.

Tôi hỏi Hassabis rằng liệu anh ấy có nghĩ rằng AIphaGo có khả năng vận hành mà không cần những dữ liệu trong lịch sử chơi cờ vây của nó.

“Chúng tôi đã thực hiện những  thí nghiệm về vấn đề trên và cho kết quả khá là khả quan. Ý tưởng về việc cải tiến AIphaGo sau này là làm cho nó bớt phụ thuộc vào việc vận hành bởi con người”.

Để có thể đánh bại Ke Jie, DeepMind cần phải sửa chữa những khuyết điểm của AIphaGo ban đầu mà Lee đã tận dụng. Mặc dù AIphaGo trở nên mạnh hơn chỉ bằng việc tự chơi với chính nó, DeepMind không thể chỉ dựa vào mỗi phương pháp ấy để cải thiện AIphaGo. “Đây không phải là một phần mềm mà bạn chỉ đơn giản sửa một lỗi bug là xong”, Hassabis người cho rằng lỗ hổng kiến thức là vấn đề luôn gặp phải của mọi loại hệ thống có khả năng học hỏi khác trong tương lai.

“Bạn phải, đại loại như dỗ ngọt để chương trình có thể tiếp thu kiến thức mới một cách tự nhiên hoặc để nó tự tìm hiểu một thêm những kiến thức trong một lĩnh vực nào đó mà chương trình chưa chạm tới, và có rất nhiều chiến thuật để đạt mục đích. Chúng ta có thể sử dụng nhiều phiên bản của AIphaGo để chúng đấu với nhau và từ đó phiên bản AIphaGo tốt nhất sẽ tiếp thu thêm nhiều chiến thuật mới”.

“Hơn nữa, chúng tôi xem xét lại những trận đấu tự chơi của AIphaGo, những thuật toán mà AIphaGo đã sử dụng lúc này và viết lại một thuật toán khác để quan sát toàn bộ ván đấu đó nhằm xác định vấn đề AIphaGo đang mắc phải. Chúng tôi có cả một thư viện để lưu trữ toàn bộ những vấn đề trên, sau đó không những chúng tôi cho AIphaGo tự đấu với chính nó, mà còn cho nó thi đấu với cơ sở dữ liệu đã được lưu trữ”.

" />

Loài người hãy tiến lên sau trận thua AlphaGo

Trận thua AlphaGo là cơ hội tiến hoá cho nhân loại

Zing.vn giới thiệu quan điểm của Sam Byford,àingườihãytiếnlênsautrậlịch thi đấu vô địch quốc gia việt nam cây viết của The Verge sau trận thắng lịch sử của AlphaGo trước kỳ thủ cờ vây số một thế giới Ke Jie.

Loai nguoi hay tien len sau tran thua AlphaGo hinh anh 1

Nếu bạn đã nghe về sự kiện mới nhất của AIphaGo vào tuần trước - nghiền nát tuyển thủ cờ vây xuất sắc nhất thế giới và được thừa nhận rằng trí tuệ nhân tạo đã trở nên tinh thông nghệ thuật chơi cờ cổ đại của Trung Quốc - ắt hẳn bạn chỉ đang nghe về sự kiện này theo một cách phóng đại quá mức.

Sự thất bại của thần đồng cờ vây 19 tuổi người Trung Quốc Ke Jie trước AlphaGo là không thể chối cãi, làm rung động toàn thể cộng đồng cờ vây toàn thế giới nói riêng và nhân loại nói chung. Hình ảnh Ke Jie gục đầu chán chường bên bàn cờ vây, vò đầu bứt tóc một cách bất lực in sâu vào tiềm thức một cách ám ảnh của người xem lúc ấy.

Tuy nhiên, chúng ta chỉ tập trung vào sự việc ấy mà đã bỏ qua nhiều vấn đề. DeepMind, một công ty sở hữu bởi Google phát triển AlphaGo không nhằm mục đích đè bẹp loài người, dù sao thì, đó là một công ty vận hành bởi chính con người. AIphaGo đại diện cho những thành tựu nổi bật của nhân loại, AI không nhằm vượt qua hay chống đối loài người, mà giúp chúng ta phát triển hơn.

Tôi đã có một vài cuộc đối thoại với DeepMind và những lập trình viên của Google tại hội nghị cấp cao Tương lai của cờ vây ở Ô Trấn, tỉnh Chiết Giang, Trung Quốc vào tuần trước, những gì họ đề cập tới là về trận thắng báo thù của Lee Se-dol chứ không phải 4 trận bại trước AlphaGo vào năm ngoái.

Loai nguoi hay tien len sau tran thua AlphaGo hinh anh 2

“Lee Se-dol khai thác triệt để điểm yếu của AIphaGo trong ván thứ tư, đó chính là lỗ hổng về kiến thức, khuyết điểm lớn nhất của AIphaGo. Chúng tôi đã làm việc cật lực để sữa chữa khuyết điểm ấy và lấp đi lỗ trống kiến thức bằng cách dạy hoặc để AIphaGo tự học hỏi những nước đi mới. Tuy nhiên, chúng tôi vẫn chưa thể thử nghiệm liệu AIphaGo có thể tốt lên hay không, cho tới khi nó đánh bại một cao thủ như Ke Jie”, đồng sáng lập DeepMind kiêm CEO Demis Hassabis chia sẻ.

Mọi chuyện xảy ra thật bất ngờ, AIphaGo áp đảo Ke với tỷ số 3-0 đồng nghĩa với việc lỗ hổng kiến thức đã được lấp đầy. Nhờ thất bại của AIphaGo với Lee, DeepMind học hỏi từ sai sót ấy và không ngừng cải tiến, nếu không thì Ke có lẽ đã chiến thắng, bởi vì tuyển thủ mạnh hơn Lee gấp nhiều lần. Hơn nữa, AIphaGo không có khả năng tự mãn.

Loai nguoi hay tien len sau tran thua AlphaGo hinh anh 3

Phiên bản AIphaGo đã thi đấu với Ke vốn được lập trình lại - Deepmind đặt tên nó là AIphaGo Master. Nó thông minh hơn phiên bản AlphaGo năm ngoái từng đấu với Lee Se-dol. 

“Cải tiến quan trọng nhất của AIphaGo chính là khả năng tự dạy bản thân. AIphaGo giờ đây tự nó tìm kiếm những thông tin cần thiết và học chúng để nâng cấp mạng lưới neuron, chúng tôi cho rằng kiến thức của AIphaGo hiện nay là rất toàn diện. Một trong những điều chúng tôi mong mỏi hiện nay là không những AIphaGo sẽ chơi cờ vây tốt hơn, mà nó sẽ trở thành đầu tàu công nghệ chính ở nhiều lĩnh vực đầy thách thức khác,” Dave Silver, nhà nghiên cứu chính của DeepMind nhận xét.

AIphaGo gồm có hai mạng lưới: Một định hình thông tin giúp lựa chọn nước đi tiếp theo, một truy xuất giá trị dùng để phân tích những khả năng dẫn đến chiến thắng. Mạng lưới thông tin này được lập trình dựa trên hàng triệu nước cờ vây của những tuyển thủ chuyên nghiệp. Nhưng, AIphaGo Master lại tiến xa hơn bằng cách tìm kiếm những khả năng có thể xảy ra khi một nước đi được thực hiện, gia tăng hiểu biết của chính nó về những nước đi sai lầm tiềm tàng.

Loai nguoi hay tien len sau tran thua AlphaGo hinh anh 4

“Chương trình AIphaGo gốc tự chơi với chính nó hàng triệu lần, nhưng lại không có khả năng tự tìm kiếm nước đi. Còn AIphaGo Master sử dụng chính sức mạnh của mình để dự đoán nước đi tiếp theo. Trong khi phiên bản tiền nhiệm chỉ có thể xử lý thông tin hữu hiệu, thì bản nâng cấp tự mình sử dụng mạng lưới thông tin để cải thiện từng chút một”, Hassabis trả lời The Verge.

Tôi hỏi Hassabis rằng liệu anh ấy có nghĩ rằng AIphaGo có khả năng vận hành mà không cần những dữ liệu trong lịch sử chơi cờ vây của nó.

“Chúng tôi đã thực hiện những  thí nghiệm về vấn đề trên và cho kết quả khá là khả quan. Ý tưởng về việc cải tiến AIphaGo sau này là làm cho nó bớt phụ thuộc vào việc vận hành bởi con người”.

Để có thể đánh bại Ke Jie, DeepMind cần phải sửa chữa những khuyết điểm của AIphaGo ban đầu mà Lee đã tận dụng. Mặc dù AIphaGo trở nên mạnh hơn chỉ bằng việc tự chơi với chính nó, DeepMind không thể chỉ dựa vào mỗi phương pháp ấy để cải thiện AIphaGo. “Đây không phải là một phần mềm mà bạn chỉ đơn giản sửa một lỗi bug là xong”, Hassabis người cho rằng lỗ hổng kiến thức là vấn đề luôn gặp phải của mọi loại hệ thống có khả năng học hỏi khác trong tương lai.

“Bạn phải, đại loại như dỗ ngọt để chương trình có thể tiếp thu kiến thức mới một cách tự nhiên hoặc để nó tự tìm hiểu một thêm những kiến thức trong một lĩnh vực nào đó mà chương trình chưa chạm tới, và có rất nhiều chiến thuật để đạt mục đích. Chúng ta có thể sử dụng nhiều phiên bản của AIphaGo để chúng đấu với nhau và từ đó phiên bản AIphaGo tốt nhất sẽ tiếp thu thêm nhiều chiến thuật mới”.

“Hơn nữa, chúng tôi xem xét lại những trận đấu tự chơi của AIphaGo, những thuật toán mà AIphaGo đã sử dụng lúc này và viết lại một thuật toán khác để quan sát toàn bộ ván đấu đó nhằm xác định vấn đề AIphaGo đang mắc phải. Chúng tôi có cả một thư viện để lưu trữ toàn bộ những vấn đề trên, sau đó không những chúng tôi cho AIphaGo tự đấu với chính nó, mà còn cho nó thi đấu với cơ sở dữ liệu đã được lưu trữ”.