Sự hình thành chữ viết tắt
Từ thuở xa xưa, con người đã biết cách sử dụng từ viết tắt hay ký hiệu để khắc chạm trên đá, trên gỗ…, nhằm gợi nhớ, tiết kiệm thời gian, công sức và vật liệu lưu trữ.
Từ viết tắt có nguồn gốc từ tiếng Hy Lạp cổ đại [32], acronym gồm akron (cuối cùng, hay đầu mút) và onoma (tên, hay tiếng). Một số từ điển tiếng Anh giải thích từ viết tắt là cách thức tạo ra một dạng từ mới ngắn gọn hơn bằng cách dùng những chữ cái đầu (initial letters), hoặc từ những từ cuối hay từ nào đó trích ra từ các từ hay cụm từ đã có. Chẳng hạn: UNESCO viết tắt từ “United Nations Educational, Scientific and Cultural Organization” (Tổ chức Giáo dục, Khoa học và Văn hoá của Liên Hiệp Quốc); DATIC (Danang Applied Technologies of the Information and Communication), v.v…
Chữ viết tắt thường có hai dạng:Viết tắt tự tạo, ngẫu nhiênvà Viết tắt theo quy luật.
Viết tắt tự tạo, ngẫu nhiên thể hiện xu hướng "tắt hóa" khi sử dụng viết chữ một cách tự nhiên của con người, là sự sáng tạo cách viết vốn rất riêng tư, nhưng cũng có thể được phổ biến. Chẳng hạn: ff: phê phán, x: nhân (con người), ~: nhưng, kh: không...
Viết tắt theo quy luật chung là cách viết tắt có sự nghiên cứu, sắp xếp, định dạng theo một quy luật nào đó định sẵn tùy từng lĩnh vực. Chẳng hạn như: Cách viết tắt bằng quy luật trích và dùng những chữ cái đầu để tạo ra một dạng từ mới ngắn gọn hơn: UBND (Ủy Ban Nhân Dân), HTX (hợp tác xã); cách viết tắt tạo bên bộ mã hóa quốc gia, trong mã vùng tỉnh thành: DNG (Đà Nẵng), QNM: (Quảng Nam)...
Một dạng khác của CVT là cách ghép liên tiếp có chủ ý các âm hay vần của đoạn cần viết tắt sao cho cụm từ mới tạo ra có ấn tượng, dễ đọc, dễ viết, hay gây ra được một sự chú ý nào đó. Ví dụ VIFOTEC (Vietnam Fund for Supporting Technological Creativeness - Quỹ Hỗ trợ Sáng tạo Kỹ thuật Việt Nam), FAHASABA (Công ty cổ phần xúc tiến thương mại điện tử và phát hành sách báo Việt Nam), DIHAVINA (Nhà xuất bản âm nhạc), v.v…
Chúng ta còn gặp CVT ở dạng rút gọn, tức là cụm từ hay đoạn văn bản cần viết tắt đã cho được rút gọn một số ký tự, hay được trích, chọn hoặc được thay thế một phần nào đó để ghép lại thành cụm các ký tự mới, tạo điều kiện thuận lợi hơn trong viết và nói. Ví dụ trong tiếng Anh, mon, tue, wed… là tên viết tắt các ngày trong tuần, jan, feb, mar… là tên viết tắt các tháng, v.v… Trong tiếng Việt cũng dùng tên viết tắt để chỉ vùng địa lý, chẳng hạn xứ Thanh, xứ Nghệ, xứ Quảng; viết tắt chỉ cách gọi: cổ (cô ấy), ổng (ông ấy); viết tắt bằng cách bỏ dấu cách, bỏ dấu sắc: quanly (quản lý) ...
Từ khi bùng nổ Internet, các ngôn ngữ viết nói chung đã được phát triển theo một hướng mới nhờ NSD sử dụng rất nhiều CVT và dấu hiệu quy ước. Chẳng hạn trong tiếng Anh, khi trao đổi bằng e-mail hay nhắn tin di động thường sử dụng IMHO để chỉ cụm từ “in my humble opinion” (theo ý kiến nông cạn của tôi), các ký hiệu khôi hài J, L, U (you)… Sử dụng CVT trong lĩnh vực CNTT và truyền thông ngày nay (Internet, nhắn tin di động, email... ) một mặt đã làm cho NSD ngày càng hưởng lợi, nhưng cũng chính sự đa dạng phong phú này của CVT, hay sự lạm dụng CVT đều gây phiền phức, nhập nhằng cho NSD.
Như vậy, vấn đề xử lý CVT phụ thuộc vào cách viết tắt. CVT đặt ra rất nhiều vấn đề phức tạp cần giải quyết, liên quan đến lĩnh vực xử lý ngôn ngữ tự nhiên và xử lý dữ liệu, cần thiết phải tìm kiếm phương pháp phân tích, tổng hợp và phân loại các nguồn dữ liệu CVT đa tạp bằng tiếng Việt và tiếng nước ngoài; đề xuất giải pháp triển khai, giúp NSD khai thác nguồn tài nguyên đã có để phục vụ của mình, tăng hiệu năng tìm kiếm,giải thích, trả lời…; xuất hiện nhu cầu cần xây dựng sớm kho ngữ liệu các CVT, tập trung phục vụ các ngành khoa học kỹ thuật, kinh tế, thương mại, du lịch, văn hoá, xã hội…, trong đó chú trọng chuyên ngành CNTT và truyền thông.
Nguyễn Nho Túy