Để trích xuất dữ liệu từ Web và chuyển sang mind map thì các công cụ cần phải có:
- https://r.jina.ai/
- https://dillinger.io/
- Chatbot AI (vd: Chat GPT)
- Xmind
Bước 1: Lấy link web cần trích xuất, vd: https://vnexpress.net/chinh-sach-noi-bat-co-hieu-luc-tu-thang-9-4787159.html
Bước 2: Đưa link trên vào Jina, thực hiện như sau:
- Cú pháp: https://r.jina.ai/DÁN-URL-Ở-ĐÂY
- Ví dụ: https://r.jina.ai/https://vnexpress.net/chinh-sach-noi-bat-co-hieu-luc-tu-thang-9-4787159.html
Kết quả được trả về như sau:


Bước 3: Up file .html ở trên vào https://dillinger.io/, mục đích để trực quan hoá, loại bỏ dữ liệu dư thừa và xuất ra file Mark Down (.md)

Kết quả được trả về như sau, sau đó ta làm sạch dữ liệu bỏ các thông tin không cần thiết như: các URL,… (như trong khung đỏ):

Sau đó, copy hết nội dung cột bên phải dán vào Word và lưu thành file .docx :


Bước 4: Vào Chat GPT, up file lên và ra lệnh nó tóm tắt và chuyển đổi thành dạng Mark Down:
Prompt: Hãy tóm tắt nội dung trong file đính kèm và nội dung được diễn giải dạng code của Mark down
Kết quả nó trả về như sau, copy toàn bộ nội dung trong hộp kết quả:

Bước 5: Copy toàn bộ nội dung ở trên vào https://dillinger.io/, mục đích để trực quan hoá dữ liệu xem lại lần nữa và xuất ra file Mark Down (.md)
Kết quả trả về như sau:







