Loại bỏ tham số (parameter) của URL trên Google Sheet
Trong quá trình xử lý dữ liệu hoặc bạn tạo dữ liệu trên Google, nếu bạn xuất từ Google Analytics, Google Search Consoler... sẽ gặp vấn đề là URL bao gồm một số biến có dấu ? ở phía sau.
Nếu gồm các tham số, việc xử lý dữ liệu sẽ không được chuẩn và khó sử dụng. Trong bài viết này mình sẽ hướng dẫn bạn cách loại bỏ tham số (hay còn gọi là parameter) trên Google Sheet.
- URL ban đầu: /xu-huong-chon-noi-chao-trang-men-trong-can-bep-hien-dai-p719.html?pageCmt=1&comments=4211
- URL kết quả: /xu-huong-chon-noi-chao-trang-men-trong-can-bep-hien-dai-p719.html
Thường khi xuất dữ liệu chúng ta sẽ có rất nhiều các tham số thừa ở phía cuối, xóa tay cũng được nhưng với 1000 URL thì chắc sếp nên đuổi việc nếu xóa tay.
Đây là lúc ra sẽ sử dụng hàm REGEXREPLACE trên Google Sheet
Bạn viết như sau
=REGEXREPLACE(A2;"\?[^?]*$";"")
Trong đó
- A2 : Là tên dòng văn bản bạn cần tìm
- \?[^?]*$ : Có ý nghĩa tìm tất cả những gì sau dấu ?
- "" : Thay thế cái đoạn tìm được bằng rỗng
Kết quả bạn sẽ được như cái hình bên trên, URL được làm sạch.
Sau đó để xóa kết quả trùng lặp thì đơn giản rồi.
Chúc bạn thành công !