Thuật toán trích xuất thông tin loại hình dịch vụ: Nghiên cứu mới của Google giúp cải thiện tìm kiếm doanh nghiệp địa phương

Trong nỗ lực nâng cao độ chính xác và khả năng hiểu ngữ cảnh của tìm kiếm địa phương, Google vừa công bố nghiên cứu về thuật toán trích xuất thông tin loại hình dịch vụ (Service Type Extraction Algorithm). Hệ thống này giúp Google tự động xác định các dịch vụ mà doanh nghiệp cung cấp thông qua nội dung trên website — từ đó cải thiện hiển thị trên Google Maps và kết quả tìm kiếm địa phương.

Đáng chú ý, nghiên cứu cũng cung cấp nhiều insight quan trọng cho người làm SEO, đặc biệt trong Local SEO và chiến lược nội dung ngữ nghĩa. Nếu bạn đang muốn tìm hiểu sâu hơn về cách Google hiểu và xử lý dữ liệu doanh nghiệp, các tool phân tích từ khóa sẽ giúp bạn khám phá xu hướng, từ khóa dịch vụ, và ý định tìm kiếm người dùng một cách hiệu quả hơn.

Tổng quan về thuật toán trích xuất thông tin loại hình dịch vụ

Thuật toán trích xuất thông tin loại hình dịch vụ là hệ thống mà Google sử dụng để xác định chính xác dịch vụ mà doanh nghiệp cung cấp, ngay cả khi thông tin này không được mô tả rõ trong Google Business Profile.

Nghiên cứu của Google cho thấy hệ thống có khả năng:

  • Quét nội dung website doanh nghiệp.
  • Phân tích các cụm từ mô tả dịch vụ.
  • Xác định loại hình hoạt động chính.
  • Liên kết thông tin đó với hồ sơ doanh nghiệp trong Google Search và Google Maps.

Ví dụ:
Nếu một công ty sửa ống nước có câu mô tả “chúng tôi cung cấp dịch vụ lắp đặt bồn cầu và sửa vòi nước,” thì hệ thống sẽ trích xuất hai loại hình dịch vụ chính là “lắp đặt bồn cầu” và “sửa vòi nước”.

Mục tiêu của thuật toán: Tối ưu trải nghiệm người dùng tìm kiếm địa phương

Mục tiêu của thuật toán: Tối ưu trải nghiệm người dùng tìm kiếm địa phương

Mục tiêu cốt lõi của Google khi phát triển thuật toán trích xuất thông tin loại hình dịch vụ là giúp người dùng:

  • Tìm đúng doanh nghiệp cung cấp dịch vụ mình cần.
  • Giảm số bước thao tác và thời gian tìm kiếm.
  • Nhận được kết quả chính xác hơn khi tìm trên Google Maps hoặc Search.

Nói cách khác, hệ thống này giúp tăng mức độ liên quan (relevance) giữa truy vấn người dùng và nội dung doanh nghiệp – từ đó cải thiện tỷ lệ tương tác và chuyển đổi trong tìm kiếm địa phương.

Ứng dụng mô hình ngôn ngữ BERT trong thuật toán

Ứng dụng mô hình ngôn ngữ BERT trong thuật toán

Để trích xuất chính xác loại hình dịch vụ, Google áp dụng mô hình ngôn ngữ BERT (Bidirectional Encoder Representations from Transformers).
Mô hình này giúp thuật toán hiểu rõ ngữ cảnh của các cụm từ xuất hiện trên trang web.

Cụ thể, BERT được huấn luyện lại (fine-tuned) dựa trên:

  • Các ví dụ được gắn nhãn thủ công về loại hình dịch vụ.
  • Cấu trúc website doanh nghiệp (menu, bảng, danh sách dịch vụ).
  • Mẫu URL phổ biến của trang dịch vụ.
  • Danh mục ngành nghề trong hồ sơ Google Business Profile.

Nhờ kết hợp các yếu tố này, Google có thể phân biệt chính xác đâu là nội dung mô tả dịch vụ thật, đâu là thông tin mang tính tham khảo hoặc gợi ý.

Cách Google huấn luyện hệ thống nhận diện loại hình dịch vụ

Cách Google huấn luyện hệ thống nhận diện loại hình dịch vụ

Giai đoạn 1: Xây dựng tập dữ liệu ban đầu

  • Google chọn hàng tỷ trang chủ doanh nghiệp có trong Google Business Profiles.
  • Từ đó, hệ thống tự động trích xuất thông tin dịch vụ từ bảng, danh sách hoặc mô tả trên trang chủ và các trang con.
  • Dữ liệu trích xuất được dùng để tạo tập hạt giống (seed set) cho việc huấn luyện mô hình.

Giai đoạn 2: Mở rộng dữ liệu bằng từ đồng nghĩa

  • Thuật toán dùng kỹ thuật query expansion (mở rộng truy vấn) để tìm thêm các từ đồng nghĩa, biến thể, hoặc cụm từ tương đương.
  • Ví dụ: “vệ sinh máy lạnh” có thể mở rộng thành “bảo trì điều hòa”, “làm sạch dàn lạnh”, giúp tăng độ bao phủ của mô hình.

Thách thức: Phân biệt nội dung thật với nội dung tham khảo

Thách thức: Phân biệt nội dung thật với nội dung tham khảo

Trong giai đoạn đầu, hệ thống gặp lỗi phổ biến là xác định sai loại hình dịch vụ.

Ví dụ, một trang blog hướng dẫn có thể viết:

“Nếu phát hiện rệp, hãy gọi dịch vụ vệ sinh nhà cửa để xử lý.”

Mặc dù có chứa cụm từ “dịch vụ vệ sinh nhà cửa”, nhưng đó không phải là website của doanh nghiệp cung cấp dịch vụ này.

Để khắc phục, Google đã phát triển kỹ thuật JobModelSurround, phân tích ngữ cảnh xung quanh cụm từ khóa dịch vụ thay vì chỉ đọc riêng từ khóa.

Lợi ích của việc hiểu ngữ cảnh trong nội dung website

Lợi ích của việc hiểu ngữ cảnh trong nội dung website

Khi thêm yếu tố “surrounding text” – tức là các từ, cụm từ trước và sau từ khóa, mô hình đã tăng độ chính xác đáng kể. Điều này cho thấy:

  • Ngữ cảnh xung quanh từ khóa đóng vai trò quyết định trong việc hiểu ý nghĩa thật sự.
  • Google không cần đọc toàn bộ trang mà vẫn hiểu được mục đích của nội dung.

Đây là cách Google tối ưu hiệu suất:

“Mô hình JobModelSurround hoạt động tốt hơn đáng kể so với mô hình cũ, chứng minh rằng việc phân tích từ khóa kèm ngữ cảnh giúp cải thiện hiểu biết ngữ nghĩa mà vẫn đảm bảo hiệu suất xử lý.”

Insight SEO từ nghiên cứu về thuật toán trích xuất thông tin loại hình dịch vụ

a. Ngữ cảnh quan trọng hơn từ khóa riêng lẻ

  • Google không chỉ xem từ khóa chính mà còn phân tích các cụm từ xung quanh.
  • Do đó, nội dung nên được viết tự nhiên, mang tính mô tả thực tế thay vì chỉ liệt kê danh sách dịch vụ.

b. Tối ưu nội dung theo cấu trúc rõ ràng

  • Đặt nội dung mô tả dịch vụ ở vị trí nổi bật trên trang.
  • Dùng các thẻ tiêu đề (H2, H3) và đoạn mô tả để Google dễ hiểu hơn.

c. Không cần nhồi nhét từ khóa

  • Việc lặp từ quá nhiều không còn hiệu quả vì thuật toán hiểu ngữ nghĩa tổng thể.
  • Tập trung vào tính giải thích và giá trị thực tế của nội dung.

d. Google không lập chỉ mục toàn bộ trang

  • Thuật toán chỉ “nhìn” vào phần có chứa cụm từ dịch vụ và nội dung liên quan.
  • Điều này tương đồng với khái niệm Centerpiece Annotation, nơi Google chỉ phân tích phần nội dung trung tâm của trang.

Tác động đối với SEO địa phương (Local SEO)

Tác động đối với SEO địa phương (Local SEO)

Với sự ra đời của thuật toán trích xuất thông tin loại hình dịch vụ, các doanh nghiệp cần chú trọng hơn vào việc viết nội dung dịch vụ chi tiết, có ngữ cảnh rõ ràng.

Đặc biệt:

  • Cần đảm bảo mỗi dịch vụ có trang riêng, mô tả cụ thể quy trình, lợi ích và kết quả.
  • Kết hợp dữ liệu có cấu trúc (schema) để tăng tính xác thực.
  • Tối ưu nội dung sao cho vừa thân thiện với người đọc vừa dễ hiểu với máy học của Google.

Bài học thực tế cho người làm SEO

Bài học thực tế cho người làm SEO
  • Viết nội dung dịch vụ theo cách “giải thích” hơn là “liệt kê”.
  • Chèn từ khóa chính vào đoạn văn có ngữ cảnh thật, ví dụ: “Chúng tôi cung cấp dịch vụ sửa điện nước, bao gồm lắp đặt đèn và sửa ổ cắm tại nhà.”
  • Tối ưu lại các trang dịch vụ cũ để đảm bảo các cụm từ xung quanh từ khóa có ý nghĩa rõ ràng.
  • Kiểm tra thường xuyên bằng công cụ như Google Search Console hoặc các tool phân tích từ khóa để theo dõi cách Google hiểu nội dung trang.

Kết luận: Thuật toán mới giúp SEO tiến gần hơn đến ngữ nghĩa thực tế

Thuật toán trích xuất thông tin loại hình dịch vụ là bước tiến quan trọng của Google trong việc hiểu sâu hơn về ngữ cảnh doanh nghiệp địa phương.

Thay vì chỉ dựa vào từ khóa, Google giờ đây xem xét ý nghĩa thực tế và mối liên hệ giữa các cụm từ — mang lại kết quả tìm kiếm chính xác hơn cho người dùng.

Đối với các chuyên gia SEO, điều này nhấn mạnh tầm quan trọng của:

  • Cấu trúc nội dung rõ ràng.
  • Viết tự nhiên, có ngữ cảnh.
  • Tối ưu hình ảnh, schema và nội dung mô tả.

Sau khi tối ưu, bạn nên thường xuyên đo lường hiệu quả qua các công cụ check thứ hạng từ khóa SEO để đảm bảo chiến lược Local SEO đang đi đúng hướng.

Nếu bạn đang theo dõi các xu hướng SEO, Digital Marketing và cập nhật mới nhất từ Google, hãy ghé qua Google KW Planner — nơi bạn có thể khám phá thêm các công cụ hữu ích như check thứ hạng từ khóa SEO, giúp theo dõi, đo lường và tối ưu hiệu quả chiến dịch của mình.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

tu-van-icon

Đăng nhập

Bạn sẽ nhận được lượt miễn phí

Hoặc, đăng nhập với Google Account

Đăng ký tài khoản

Tạo tài khoản mới để bắt đầu