
Các nhà phát triển giỏi tiếng sinh muốn giao tiếp với đám đông toàn cầu chưa bao giờ dễ dàng như vậy. Google Dịch tin cậy có thể chuyển đổi nội dung từ hình ảnh, âm thanh và toàn bộ trang web qua hàng trăm ngôn ngữ, trong khi các công cụ mới như ChatGPT cũng phục vụ như những người dịch túi tiện lợi.
Ở phía sau, DeepL và ElevenLabs đã đạt đến các giá trị địa vị tỷ đô cho các sáng kiến liên quan đến ngôn ngữ mà doanh nghiệp có thể hứng lên ứng dụng của mình. Nhưng một người chơi mới đang bước vào cuộc chiến, với một định vị AI được cung cấp bởi địa phương hóa động cơ giúp các nhà phát triển mở rộng quy mô toàn cầu - như một “Stripe” cho địa phương hóa ứng dụng, nếu bạn muốn.
Từ trước được biết đến với tên gọi Replexica, Lingo.dev hướng đến các nhà phát triển muốn làm cho giao diện trước của ứng dụng của họ được địa phương hóa hoàn toàn từ đầu; tất cả những gì họ cần phải lo lắng là vận chuyển mã của họ như mọi khi, với Lingo.dev hoạt động dưới mặt nạ tự động. Một điểm ngóc là không có sao chép/dán văn bản giữa ChatGPT (cho các bản dịch nhanh chóng và dơ dáy), hoặc làm phiền với nhiều tệp dịch ở định dạng khác nhau được lấy từ nhiều cơ quan.
Hiện nay, Lingo.dev đếm khách hàng như công ty ngựa vằn Pháp Mistral AI và đối thủ mã nguồn mở Calendly Cal.com. Để thúc đẩy giai đoạn tăng trưởng tiếp theo, công ty đã thông báo rằng họ đã huy động được 4,2 triệu USD trong vòng gói vốn hạt giống do Initialized Capital dẫn đầu, với sự tham gia từ Y Combinator và một số nhà tài trợ khác.
Được dịch sang
Lingo.dev là sản phẩm của CEO Max Prilutskiy và CPO Veronica Prilutskaya (được thể hiện ảnh trên) đã thông báo rằng họ đã bán một công ty khởi nghiệp SaaS trước đó có tên là Notionlytics cho một người mua không tiết lộ vào năm ngoái. Cặp đôi này đã bắt đầu làm nền tảng của Lingo.dev từ năm 2023, với phiên bản nguyên mẫu đầu tiên được phát triển như một phần của một cuộc thi hackathon tại Đại học Cornell. Điều này dẫn đến khách hàng trả tiền đầu tiên của họ, trước khi tiếp tục tham gia chương trình mùa thu Y Combinator (YC) vào năm ngoái.
Ở lõi của nó, Lingo-dev là một API Dịch chỉ có thể được gọi cục bộ bởi các nhà phát triển thông qua CLI của họ (giao diện dòng lệnh), hoặc thông qua việc tích hợp trực tiếp với hệ thống CI/CD của họ thông qua GitHub hoặc GitLab. Vì vậy, nhóm phát triển nhận được yêu cầu kéo cập nhật dịch tự động mỗi khi có một thay đổi mã tiêu chuẩn được thực hiện.
Ở trái tim của tất cả điều này, như bạn có thể mong đợi, là một mô hình ngôn ngữ lớn (LLM) - hoặc nhiều LLM, để chính xác, với Lingo.dev điều chỉnh các đầu vào và đầu ra giữa chúng. Phương pháp phối hợp này, kết hợp các mô hình từ Anthropic, OpenAI, giữa các nhà cung cấp khác nhau, được thiết kế để đảm bảo chọn lựa mô hình tốt nhất cho công việc hiện tại.
“Các lời nhắc khác phù hợp hơn với một số mô hình hơn so với các mô hình khác,” Prilutskiy giải thích với TechCrunch. “Cũng phụ thuộc vào trường hợp sử dụng, chúng tôi có thể muốn có độ trễ tốt hơn, hoặc độ trễ không quan trọng.”
Tất nhiên, không thể nói về các LLM mà không nói về bảo mật dữ liệu - một trong những lý do mà một số doanh nghiệp chậm chạp trong việc áp dụng AI sáng tạo. Nhưng với Lingo.dev, tập trung chủ yếu là vào việc địa phương hóa các giao diện trước, mặc dù cũng phục vụ nội dung doanh nghiệp như trang web tiếp thị, email tự động, và nhiều hơn nữa - nhưng không truyền dữ liệu cá nhân có thể xác định của bất kỳ khách hàng nào, ví dụ.
“Chúng tôi không mong đợi bất kỳ dữ liệu cá nhân nào được gửi đến chúng tôi,” Prilutskiy nói.
Thông qua Lingo.dev, các công ty có thể xây dựng những ký ức dịch (một cửa hàng của nội dung đã được dịch trước) và tải lên hướng dẫn phong cách của họ để tùy chỉnh giọng của thương hiệu cho các thị trường khác nhau.

Các công ty cũng có thể xác định các quy tắc liên quan đến cách xử lý các cụm từ cụ thể và trong tình huống nào. Hơn nữa, động cơ có thể phân tích vị trí của văn bản cụ thể, thực hiện các điều chỉnh cần thiết trên đường đi - ví dụ, một từ khi được dịch từ tiếng Anh sang tiếng Đức có thể có gấp đôi số ký tự, có nghĩa là nó sẽ phá vỡ giao diện người dùng. Người dùng có thể chỉ đạo động cơ vượt qua vấn đề đó bằng cách diễn đạt lại một phần văn bản để nó khớp với chiều dài của văn bản ban đầu.
Mà không có bối cảnh rộng lớn về ứng dụng thực sự là gì, có thể khó để địa phương hóa một phần nhỏ duy nhất của văn bản đứng một mình, như một nhãn trên một giao diện. Lingo.dev vượt qua vấn đề này bằng một tính năng được gọi là “nhận biết ngữ cảnh”, nơi nó phân tích toàn bộ nội dung của tập tin dịch, bao gồm văn bản liền kề hoặc các phím hệ thống sự kiện mà tệp dịch đôi khi có. Điều quan trọng là hiểu biết về “bối cảnh nhỏ”, như Prilutskiy nói.
Và trong tương lai, còn nhiều hơn sẽ đến với điều này nữa.
“Chúng tôi đang làm việc vào một tính năng mới sử dụng các ảnh chụp màn hình của giao diện ứng dụng, mà Lingo.dev sẽ sử dụng để khai thác thêm gợi ý ngữ cảnh về các yếu tố giao diện người dùng và ý định của họ,” ông nói.

Địa phương hóa
Vẫn còn khá sớm cho Lingo.dev về con đường đến việc địa phương hóa đầy đủ. Ví dụ, màu sắc và biểu tượng có thể có ý nghĩa khác nhau giữa các văn hóa khác nhau, điều mà Lingo.dev không phục vụ trực tiếp. Hơn nữa, những thứ như chuyển đổi đo lường/imperial vẫn cần được địa chỉ bởi nhà phát triển tại cấp độ mã.
Tuy nhiên, Lingo.dev hỗ trợ khung truyền bản tin, mà xử lý sự khác biệt trong việc biểu thị số nhiều và cụm từ cụ thể về giới giữa các ngôn ngữ. Công ty cũng vừa phát hành một tính năng beta thử nghiệm đặc biệt dành cho tục ngữ; ví dụ, “ghi chết hai con chim bằng một viên đá” có một tương đương tiếng Đức dịch chừng như “đánh rơi hai con ruồi với một mớ.”
Ngoài ra, Lingo.dev cũng đang tiến hành nghiên cứu AI ứng dụng để cải thiện các khía cạnh khác nhau của quy trình địa phương hóa tự động.
“Một trong những nhiệm vụ phức tạp chúng tôi đang làm việc hiện nay là bảo quản các phiên bản nữ/nam của danh từ và động từ khi dịch giữa các ngôn ngữ,” Prilutskiy nói. “Các ngôn ngữ khác nhau mã hóa các lượng thông tin khác nhau. Ví dụ, từ ‘giáo viên’ trong tiếng Anh là giống giới, nhưng trong tiếng Tây Ban Nha là ‘maestro’ (nam) hoặc ‘maestra’ (nữ). Việc đảm bảo những sắc thái này được bảo quản chính xác thuộc vào các nỗ lực nghiên cứu AI ứng dụng của chúng tôi.”
Ở cuối cùng, kế hoạch trò chơi là về rất nhiều hơn là chỉ dịch đơn giản: Nó muốn đưa mọi thứ gần giống như có thể so với những gì bạn có thể nhận được với một đội ngũ phiên dịch chuyên nghiệp.
“Nhìn chung, [mục tiêu] với Lingo.dev là loại bỏ sự ma sát từ việc địa phương hóa một cách cẩn thận, để nó trở thành một lớp cơ sở hạ tầng và một phần tự nhiên của bộ công cụ công nghệ,” Prilutskiy nói. “Tương tự như cách Stripe loại bỏ sự ma sát từ thanh toán trực tuyến một cách hiệu quả để trở thành một bộ công cụ cốt lõi cho thanh toán của các nhà phát triển.”
Mặc dù các nhà sáng lập gần đây đóng cửa chính yếu ở Barcelona, họ đang chuyển đến ở San Francisco. Công ty chỉ có ba nhân viên tổng cộng, với một kỹ sư sáng lập tạo thành ba người - và đây là triết lý khởi nghiệp mảnh mai mà họ định theo đuổi.
“Mọi người ở YC, tôi và các nhà sáng lập khác, chúng tôi đều là người tin giả trong điều đó,” Prilutskiy nói.
Công ty khởi nghiệp trước đó của họ, cung cấp phân tích cho Notion, đã hoàn toàn được khởi động với khách hàng nổi tiếng bao gồm Square, Shopify và Sequoia Capital - và không có nhân viên nào ngoài Max và Veronica.
“Chúng tôi là hai người, toàn thời gian, nhưng có một số nhà thầu cho các điều khác nhau đôi khi,” Prilutskiy thêm. “Nhưng chúng tôi biết cách xây dựng các điều với tài nguyên tối thiểu. Bởi vì công ty trước đó là khởi động, vì vậy chúng tôi phải tìm cách để điều này hoạt động. Và chúng tôi đang làm phương pháp lean giống như thế - nhưng giờ với vốn tiếp tục.”