Wumpus World:
Wumpus World là một ví dụ thế giới đơn giản để minh họa giá trị của một agent dựa trên tri thức và đại diện cho sự đại diện của tri thức. Nó được lấy cảm hứng từ trò chơi điện tử Hunt the Wumpus của Gregory Yob vào năm 1973.
Wumpus World là một hang động có 4/4 phòng thông với các lối đi. Như vậy có tổng cộng 16 phòng được kết nối với nhau. Chúng tôi có một đại diện dựa trên kiến thức, những người sẽ tiến lên trong thế giới này. Hang động có một căn phòng với một con quái vật được gọi là Wumpus, kẻ ăn thịt bất cứ ai vào phòng. Agent có thể bắn Wumpus, nhưng Agent chỉ có một mũi tên. Trong thế giới của Wumpus, có một số căn phòng Pits là không đáy, và nếu Agent rơi vào Pits, thì anh ta sẽ bị mắc kẹt ở đó mãi mãi. Điều thú vị với hang động này là trong một căn phòng có khả năng tìm thấy một đống vàng. Vì vậy, mục tiêu của Agent là tìm vàng và leo ra khỏi hang động mà không bị rơi xuống hố hoặc bị Wumpus ăn thịt. Agent sẽ nhận được phần thưởng nếu anh ta mang vàng, và anh ta sẽ bị phạt nếu bị Wumpus ăn thịt hoặc rơi xuống hố.
Các bài viết liên quan:
Lưu ý: Ở đây Wumpus ở trạng thái tĩnh và không thể di chuyển.
Sau đây là một sơ đồ mẫu để đại diện cho Wumpus World. Nó đang hiển thị một số phòng có Pits, một phòng có Wumpus và một Agent tại (1, 1) vị trí hình vuông trên thế giới.
Ngoài ra còn có một số thành phần có thể giúp Agent điều hướng hang động. Các thành phần này được đưa ra như sau:
- Các phòng liền kề với phòng Wumpus đều có mùi, vì vậy nó sẽ có một số mùi hôi thối.
- Phòng liền kề với PIT có gió nên nếu tác nhân đến gần PIT thì sẽ cảm nhận được gió.
- Sẽ có ánh sáng lấp lánh trong phòng nếu và chỉ khi căn phòng có vàng.
- Wumpus có thể bị giết bởi Agent nếu Agent đối mặt với nó, và Wumpus sẽ phát ra một tiếng hét khủng khiếp có thể nghe thấy ở bất cứ đâu trong hang.
Mô tả của PEAS về Wumpus World:
Để giải thích Wumpus World, chúng tôi đã đưa ra mô tả PEAS như sau:
Đo lường hiệu suất:
- +1000 điểm thưởng nếu Agent mang vàng ra khỏi hang.
- -1000 điểm phạt nếu bị Wumpus ăn hoặc rơi xuống vực.
- -1 cho mỗi hành động và -10 cho việc sử dụng một mũi tên.
- Trò chơi kết thúc nếu một trong hai Agent chết hoặc ra khỏi hang.
Môi trường:
- Phòng dạng lưới 4 * 4.
- Nhân viên ban đầu ở trong phòng vuông [1, 1], quay mặt về phía bên phải.
- Vị trí của Wumpus và vàng được chọn ngẫu nhiên ngoại trừ ô đầu tiên [1,1].
- Mỗi hình vuông của hang động có thể là một cái hố với xác suất 0,2 ngoại trừ hình vuông đầu tiên.
Di chuyển:
- Left turn,
- Right turn
- Move forward
- Grab
- Release
- Shoot.
Cảm biến:
- Agent sẽ cảm nhận được mùi hôi thối nếu anh ta ở trong căn phòng liền kề với Wumpus. (Không theo đường chéo).
- Agent sẽ cảm nhận được làn gió nhẹ nếu anh ta ở trong phòng trực tiếp liền kề với Hố.
- Agent sẽ cảm nhận được ánh sáng lấp lánh trong căn phòng có vàng.
- Agent sẽ cảm nhận được vết sưng nếu anh ta đi vào một bức tường.
- Khi Wumpus bị bắn, nó phát ra một tiếng hét khủng khiếp có thể nhận thấy ở bất cứ đâu trong hang động.
- Các khái niệm này có thể được biểu diễn dưới dạng danh sách năm phần tử, trong đó chúng ta sẽ có các chỉ số khác nhau cho từng cảm biến.
- Ví dụ nếu tác nhân nhận thấy mùi hôi thối, gió thoảng, nhưng không long lanh, không va chạm và không có tiếng la hét thì nó có thể được biểu thị là:
[Stench, Breeze, None, None, None]
Thuộc tính của Wumpus World:
- Có thể quan sát được một phần: Thế giới của Wumpus có thể quan sát được một phần vì tác nhân chỉ có thể cảm nhận được môi trường gần như một căn phòng liền kề.
- Tính xác định: Nó mang tính xác định, vì kết quả và kết quả của thế giới đã được biết trước.
- Trình tự: Thứ tự là quan trọng, vì vậy nó là tuần tự.
- Tĩnh: Nó là tĩnh vì Wumpus và Pits không di chuyển.
- Rời rạc: Môi trường rời rạc.
- Môi trường là một tác nhân duy nhất vì chúng tôi chỉ có một tác nhân duy nhất và Wumpus không được coi là một tác nhân.
Khám phá Wumpus World:
Bây giờ chúng ta sẽ khám phá Wumpus World và sẽ xác định cách mà Agent sẽ tìm thấy mục tiêu của mình bằng cách áp dụng suy luận logic.
- Bước đầu tiên của agent:
Ban đầu, Agent ở trong phòng đầu tiên hoặc trên hình vuông [1,1], và chúng ta đã biết rằng phòng này an toàn cho Agent, vì vậy, để biểu diễn trên sơ đồ dưới đây (a) phòng đó an toàn, chúng ta sẽ thêm ký hiệu OK. Biểu tượng A được sử dụng để đại diện cho Agent, biểu tượng B cho gió, G cho lấp lánh hoặc vàng, V cho căn phòng đã đến thăm, P cho hố, W cho Wumpus.
Tại Phòng [1,1] Agent không cảm thấy bất kỳ làn gió nào hoặc bất kỳ mùi hôi thối nào có nghĩa là các ô liền kề cũng OK.
- Bước thứ hai của Agent:
Bây giờ tác nhân cần phải di chuyển về phía trước, vì vậy nó sẽ di chuyển đến [1, 2] hoặc [2,1]. Giả sử Agent di chuyển đến căn phòng [2, 1], tại căn phòng này, Agent nhận thấy một cơn gió nhẹ có nghĩa là Pit đang ở xung quanh căn phòng này. Hố có thể nằm trong [3, 1], hoặc [2,2], vì vậy chúng ta sẽ thêm ký hiệu P? để nói rằng, đây có phải là phòng Pit không?
Bây giờ Agent sẽ dừng lại và suy nghĩ và sẽ không thực hiện bất kỳ động thái có hại nào. Agent sẽ quay trở lại phòng [1, 1]. Phòng [1,1] và [2,1] đã được Agent đến thăm, vì vậy chúng tôi sẽ sử dụng ký hiệu V để tái trình bày các hình vuông đã thăm.
- Bước thứ ba của Agent:
Ở bước thứ ba, bây giờ Agent sẽ chuyển đến phòng [1,2] là OK. Trong phòng [1,2] Agent nhận thấy mùi hôi thối có nghĩa là phải có Wumpus ở gần đó. Nhưng Wumpus không được ở trong phòng [1,1] theo luật chơi, và cũng không được ở [2,2] (Agent không phát hiện ra mùi hôi thối nào khi anh ta ở [2,1]). Do đó tác nhân suy luận rằng Wumpus đang ở trong phòng [1,3], và ở trạng thái hiện tại, không có gió, có nghĩa là trong [2,2] không có Pit và không có Wumpus. Vì vậy, nó là an toàn, và chúng tôi sẽ đánh dấu là OK, và Agent sẽ tiến xa hơn trong [2,2].
- Bước thứ tư của Agent:
Tại phòng [2,2], ở đây không có mùi hôi thối và không có gió nên giả sử Agent quyết định chuyển đến [2,3]. Tại phòng [2,3] Agent cảm nhận được sự lấp lánh, vì vậy nó nên lấy vàng và leo ra khỏi hang.