Loại bỏ tham số (parameter) của URL trên Google Sheet

Trong quá trình xử lý dữ liệu hoặc bạn tạo dữ liệu trên Google, nếu bạn xuất từ Google Analytics, Google Search Consoler… sẽ gặp vấn đề là URL bao gồm một số biến có dấu ? ở phía sau.

Nếu gồm các tham số, việc xử lý dữ liệu sẽ không được chuẩn và khó sử dụng. Trong bài viết này mình sẽ hướng dẫn bạn cách loại bỏ tham số (hay còn gọi là parameter) trên Google Sheet.

  • URL ban đầu: https://nguyencaotu.com/xu-huong-chon-noi-chao-trang-men-trong-can-bep-hien-dai-p719.html?pageCmt=1&comments=4211
  • URL kết quả: https://nguyencaotu.com/xu-huong-chon-noi-chao-trang-men-trong-can-bep-hien-dai-p719.html
Loại bỏ tham số (parameter) của URL trên Google Sheet
Loại bỏ tham số (parameter) của URL trên Google Sheet

Thường khi xuất dữ liệu chúng ta sẽ có rất nhiều các tham số thừa ở phía cuối, xóa tay cũng được nhưng với 1000 URL thì chắc sếp nên đuổi việc nếu xóa tay.

Đây là lúc ra sẽ sử dụng hàm REGEXREPLACE trên Google Sheet

Bạn viết như sau

=REGEXREPLACE(A2;"\?[^?]*$";"")

Trong đó

  • A2 : Là tên dòng văn bản bạn cần tìm
  • \?[^?]*$ : Có ý nghĩa tìm tất cả những gì sau dấu ?
  • “” : Thay thế cái đoạn tìm được bằng rỗng

Kết quả bạn sẽ được như cái hình bên trên, URL được làm sạch.

Sau đó để xóa kết quả trùng lặp thì đơn giản rồi.

Chúc bạn thành công !

Tác giả hiện là CEO của Sudo - Công ty thiết kế web, phần mềm. Tú có kiến thức cơ bản về CNNT, chuyên môn am hiểu trong lĩnh vực Online Marketing. "Hạnh phúc không phải là nhận, hạnh phúc chính là sự cho đi" - đây là lý do Tú xây dựng Blog này. Bài viết trên dự dựa trên quan điểm, hiểu biết của cá nhân. Nó có thể đúng, cũng có thể sai tùy thời điểm, vì vậy bạn phải tự cân nhắc và chịu trách nhiệm khi làm theo. Nếu nội hữu ích với bạn, hãy Mời Tú Cao một tách CÀ PHÊ.