Giới thiệu & Tư duy Sản phẩm
1. Vấn đề (The Problem)
Trong quy trình phát triển phần mềm, tài liệu hướng dẫn sử dụng (User Guide) thường là phần bị bỏ quên hoặc làm sơ sài nhất vì:
- Tốn thời gian: Phải chụp ảnh từng bước, crop ảnh, highlight, viết mô tả.
- Khó bảo trì: Khi giao diện thay đổi (dù chỉ là đổi màu nút hay vị trí), phải làm lại từ đầu.
- Thiếu đồng bộ: Mỗi người viết một kiểu, không có chuẩn mực chung.
- Nhàm chán: Công việc lặp đi lặp lại, ít tính sáng tạo.
💡 Thực tế: Một tính năng mất 2 ngày code nhưng có thể mất 1 ngày để viết tài liệu chi tiết.
2. Giải pháp: Auto Docs Generator
Chúng ta tiếp cận vấn đề theo tư duy "Documentation as Code" kết hợp với Generative AI.
Core Concept
- Record: Thay vì chụp ảnh thủ công, ta "ghi hình" thao tác người dùng.
- Replay: Máy tính thực hiện lại thao tác đó để chụp ảnh chất lượng cao.
- Generate: AI "nhìn" ảnh và viết mô tả thay cho con người.
Tại sao lại cần AI?
Trước đây, các tool automation (như Selenium IDE) chỉ có thể ghi lại code: click(#btn-login). Nó không hiểu nút đó có ý nghĩa gì về mặt nghiệp vụ.
Với Multimodal AI (Gemini Pro Vision / GPT-4V), máy tính có thể:
- Hiểu ngữ cảnh: "Đây là màn hình đăng nhập".
- Hiểu hành động: "Người dùng đang nhập mật khẩu".
- Viết văn bản: "Bước 1: Nhập mật khẩu của bạn vào ô trống."
3. Giá trị mang lại
| Tiêu chí | Cách truyền thống | Auto Docs Generator |
|---|---|---|
| Tốc độ | 30-60 phút / guide | 2-5 phút / guide |
| Cập nhật | Làm lại thủ công | Chạy lại lệnh (Replay) |
| Chi phí | Cao (nhân sự) | Thấp (API cost ~0.01$/guide) |
| Chất lượng | Phụ thuộc người viết | Đồng nhất, văn phong chuyên nghiệp |
4. Use Cases (Trường hợp sử dụng)
- Product Documentation: Tạo hướng dẫn sử dụng cho khách hàng cuối.
- Internal Training: Tài liệu đào tạo nhân viên mới (Onboarding).
- QA/Testing Evidence: Ghi lại bằng chứng test tự động kèm giải thích.
- Migration: Document lại hệ thống cũ trước khi đập đi xây lại.
5. Roadmap phát triển
Tool hiện tại mới chỉ là khởi đầu. Tiềm năng mở rộng còn rất lớn:
- [ ] Video Generation: Tự động tạo video hướng dẫn từ các bước đã ghi.
- [ ] Multi-language: Dịch tài liệu sang nhiều ngôn ngữ chỉ với 1 click.
- [ ] Voiceover: Thêm giọng đọc AI cho video.
- [ ] Integration: Tự động push lên Confluence/GitBook.