Trang chủ Hiệp sĩ CNTT Tin tức Hiệp Sĩ CNTT Chân dung Hiệp Sĩ CNTT Hình ảnh Hiệp Sĩ CNTT

Tự bạch của “Hiệp sĩ” Trần Triết Tâm:
Mong có bạn chứng minh rằng... tôi lầm!

AutoMark, và sau này là AMPad, là một công cụ dùng để xử lý tiếng Việt không dấu. Đây không phải là một bộ gõ tiếng Việt và không hoạt động độc lập. Chương trình xử lý không bao giờ hoàn chỉnh 100% như ý muốn. Tuy nhiên nếu dùng để xử lý các văn bản tiếng Việt (không bỏ dấu) đúng chính tả, văn phạm thì kết quả rất cao (có thể đúng 97% trên tổng số từ được xử lý).
Chương trình này được tôi thực hiện trong khoảng một năm với trên 10.000 dòng lệnh. Nền tảng của chương trình là thống kê tần suất xuất hiện của các từ có dấu tương ứng với một từ không dấu, thêm các thuật toán để lựa chọn và đề xuất từ thích hợp... Từ khi viết chương trình đến nay, tôi rất vui vì nhận được khá nhiều ý kiến đóng góp, nhất là các bạn ở nước ngoài (hình như ở nước ngoài không quen sử dụng bộ gõ tiếng Việt lắm).
Tôi chỉ tiếc vài điều sau:
 Chương trình chỉ nâng cấp được hai lần từ AutoMark lên AMPad 1.1 (có trong dĩa CD kèm theo e-CHÍP số 1), và AMPad 1.2 thì chấm dứt do sự cố về ổ cứng khiến tôi bị mất toàn bộ mã nguồn của chương trình. Cũng vì vậy, một số bạn ngỏ ý xin mã nguồn, tôi đã đồng ý nhưng sự cố ổ cứng đã khiến tôi không thực hiện được lời hứa.
 Chương trình không hỗ trợ mã Unicode và không hoạt động trong Win XP.
Với AutoMark và AMPad, điều làm tôi vui nhất là đã quen được một số bạn. Tôi chân thành cảm ơn các bạn đã quan tâm sử dụng thử. Dù sao, đây vẫn là một công cụ mà kết quả xử lý không bao giờ đạt kết quả tuyệt đối nên có lẽ một số bạn cũng có phần thất vọng. Tôi đã từng nghĩ có thể xử lý tiếng Việt không dấu thành tiếng Việt có dấu 100% nhưng sau khi viết chương trình, tôi mới phát hiện ra là điều đó gần như sẽ không bao giờ thực hiện được. Mong rằng trong tương lai sẽ có bạn nào đó sẽ chứng minh là tôi đã lầm!

Tên: Trần Triết Tâm
Tuổi: 44
Nghề nghiệp:
Chuyên viên Thống kê
Nơi công tác: Cục Thống kê thành phố Đà Nẵng