Phân loại SPAM Google (Những hình thức spam trong Website)

Tú Cao Tác giả Tú Cao 03/03/2014 24 phút đọc

Hiện tại có rất nhiều Website đang gặp vấn đề, theo tìm hiểu của Tú thì quá trình quyét SPAM của Google bắt đầu từ 15/2 trên thế giới. Bắt đầu đem ngày 25/2 thì lần lượt các Website ở Việt Nam bắt đầu nhận được những thông báo cảnh bảo rất nặng từ Google, thậm chi là phạt chúng. 

Để thuận tiện và cho mọi người hiểu rõ, Tú sẽ dựa vào những dạng SPAM của Google cung cấp, và cố gắng mô tả để từ đây bạn có thể xem lại chính Website của mình. Và khi bị phạt sẽ phân biệt được lý do mình bị Google phạt SPAM. Và có cách xử lý phù hợp và hiệu quả.

Tác vụ thủ công SPAM GOOGLE là gì?

Biểu đồ spam google
Biểu đồ dạng Spam bổ biến của Google

Phần loại SPAM GOOGLE

+ Kỹ thuật che giấu và/hoặc chuyển hướng lén lút

Trang web dường như đang sử dụng kỹ thuật che giấu (hiển thị nội dung cho người dùng khác với cho công cụ tìm kiếm) hoặc đang chuyển hướng người dùng đến trang khác với trang mà Google thấy.

Những kỹ thuật che dấu này thường được gọi là dạng SPAM mũ đen, sử dụng những kỹ thuật liên quan tới SERVER, Lập trình Website để xử lý. Các dạng kỹ thuật che dấu nội dung

  1. Sử dụng nội kích thước chữ quá nhỏ (1px đến 2px...) (VD:

Nội dung Text

  1. ) : Do kích thước quá nhỏ nên người dùng không thể nhìn thấy được nội dung. Trong khi con Robots thì vẫn đọc được bình thường.
  2. Sử dụng màu chữ, trùng với màu nền (VD:

Nội dung text

  1. ). Khi màu chữ trùng với màu nền, người dùng chỉ có thể bôi đen mới có thể hiển thị được nội dung.
  2. Sư dụng thuộc tính căn chỉnh vị trí kích thước của một đối tượng để ẩn nội dung(float, margin, padding, position....). Bằng cách này, người thiết kế có thể che dấu được nội dung hiển thị cho người dùng một cách rất đơn giản. (VD: margin-left:-10000px).

Kỹ thuật chuyển hướng. 

Kỹ thuật chuyển hướng sử dụng thủ thuật về điều hướng robots để chuyển hướng chúng. Tức là khi người dùng truy cập vào Website, robots truy cập vào Website đó sẽ thấy 2 nội dung khác nhau. (Những con robots khi truy cập vào Website có đặc điểm nhận dạng riêng so với truy cập của người dùng bình thường, có thể điều hướng chúng thông qua IP, và những đặc điểm nhận dạng đó.) 

Kết luận: Trong những cách che dấu nội dun kể trên thuộc dạng SPAM của Google. Các bạn có thể dễ dàng để bắt gặp ở bất kỳ đâu, cũng có những cách làm hài hòa rất khó đẻ việc check SPAM tự động của Google thực hiện. Tuy nhiên Tú Cao cũng không khuyến khích các bạn, kể cả việc đối thủ của các bạn có sử dụng phương pháp kể trên thì cũng đừng quá lo lắng. (Cho dù tác vụ SPAM thủ công có thể quyét được hoặc không, tuy nhiên nó vẫn có những rủi ro nhất định - Không tiện đề cập, tránh loạn lạc và cạnh tranh không lành mạnh) 

Khắc phục: Bạn tự sửa chữa lại, loại bỏ các dạng thủ thuật của mình. Chỉnh bạn làm những gì sai, bạn sẽ biết chỗ để sửa.

Phân loại các dạng SPAM GOOGLE và khắc phục.
Phân loại các dạng SPAM GOOGLE và khắc phục.

+Trang web bị tấn công

Một số trang trên trang web này có thể đã bị bên thứ ba tấn công nhằm hiển thị nội dung hoặc các liên kết spam. Chủ sở hữu trang web phải thực hiện hành động ngay lập tức để làm sạch trang web của họ và sửa bất kỳ lỗ hổng bảo mật nào.

Có thể bạn không chèn những liên kết ẩn kể trên, nhưng rất có thể nó bị tấn công từ bên ngoài, và kẻ tấn công đã âm thầm chèn những liên kết của họ vào bên trong. (Sử dụng chính "Kỹ thuật che giấu và/hoặc chuyển hướng lén lút" Tú đã đề cập ở phần trên). 

Để kiểm tra có bị chèn mã liên kết độc hay không cũng khá đơn giản, bằng cách bạn mở trình duyệt của mình bằng trình duyệt. (Với Firefox và Chrome bạn nhấn CTRL + U để mở "Page Source - Mã nguồn trang dạng HTML" ). 

Tiếp đó bạn nhấn CTRL + F để tìm kiếm những liên kết lạ, bằng các Keyword đưa vào là những domain phổ biến như .com , .net, .vn ....) Có một cách đơn giản hơn là dùng các Add-on check External link (VD: SEOQUAKE), nó sẽ cho bạn biết Page bạn kiểm tra số lượng link out ra ngoài, từ danh sách này bạn có thể biết có tồn tại hay không những liên kết "lạ" trong Website của bạn. 

Khắc phục: Bạn gỡ bỏ các link ẩn, có gắn trong Code. Các bạn cần kiểm tra thật kỹ để loại bỏ những con virust có trên web (Hacker gọi nó là shell), nhớ check kỹ cả database vì trong database cũng có thể bị gắn mã độc.

Các tốt nhất mà hay được sử dụng nhất: Xóa toàn bộ code cũ, sau đó lấy bộ code mới tải lên. 

Ngoài ra bạn có thể sử dụng các trương trình Antivirust như Kaspersky, Norton Antivirust.... tại toàn bộ website về, sau đó dùng phần mềm kể trên để quyét. Database thì có thể view soruce, hoặc check với keyword base64 - một dạng mã hóa shell hay được chèn vào database.

+Văn bản ẩn và/hoặc nhồi nhét từ khóa

Một số trang có thể chứa văn bản ẩn và/hoặc bị nhồi nhét từ khóa.

Văn bản ẩn có nhiều cách như đã đề cập ở dạng SPAM GOOGLE 01 bên trên, ngoài ra với những người lập trình họ còn có thể sử dụng thuộc tính display:hidden trong CSS. Cũng là một cách làm ẩn nội dung nhanh chóng. 

Việc bạn nhồi nhét từ khóa dạng keyword, keyword, keyword một cách quá mức cũng sẽ bị dính thuật toán SPAM này. Dạng phát hiện SPAM này khá dễ dàng, vì thế khuyên bạn nên cẩn trọng hơn trong việc chèn keyword vào bên trong nội dung. 

Phương pháp On-Page mọi người nên nắm thật vững, và đừng cố gắng nhồi nhét, hãy viết hướng người dùng một cách tự nhiên. 

Để thuận tiện, Tú Cao cũng gợi ý cho mọi người tỷ lệ mật độ từ khóa (Keyword Density) của một từ khóa các bạn nên truy trì ở dạng từ 3% đến 5%, khi bạn đạt trên 7% thì bạn cũng nên cẩn thận. (Công cụ check Keyword Density Tú hay dùng cũng là SEO Quake, ngoài ra bạn có thể sử dụng rất nhiều các tools khác). 

Khắc phục: Kiểm tra lại tỷ lệ mật độ từ khóa - Keyword Density, nếu thấy chúng tăng đột biến thì hãy chỉnh sủa lại nội dung.

+Tên miền trỏ hướng

Tên miền trỏ hướng là các trang web giữ chỗ với rất ít nội dung duy nhất, do vậy Google thường không đưa các trang web này vào kết quả tìm kiếm.

Đây thực chất không phải là SPAM. Mà chỉ là những domain không sử dụng => cũng không SEO => vậy cũng không cần quan tâm tới điều này. Tuy nhiên nếu bạn đang có một DOMAIN, và muốn giữ chỗ một DOMAIN. Cách tốt nhất bạn nên chặn INDEX của Website đó. Ví dụ bằng đoạn code sau cho trang INDEX.

Chặn index domain
Tạo 1 file index.htm với nội dung như trên, sau đó tải lên thư mục gốc.

Hoặc bạn có thể sử dụng 1 file robots.txt với nội dung User-agent: * Disallow: /

+Spam thuần túy

Có vẻ như trang web sử dụng các kỹ thuật spam có tính công kích chẳng hạn như nội dung vụn vặt, che giấu, văn bản vô nghĩa được tạo tự động từ các trang web khác và/hoặc vi phạm nghiêm trọng hoặc tái vi phạm Nguyên tắc quản trị trang web của Google.

Dạng này thì chủ yếu đánh vào nội dung của bạn có chất lượng hay không? Việc bạn có quá nhiều nội dung, nhưng nội dung không cung cấp giá trị tốt cho người dùng bạn sẽ dính vào dạng này. 

Bạn nên điều hướng robots một cách khôn ngoan, và chặn index bằng canonical, bằng robots.txt, bằng meta robots, nofollow một cách hợp lý. Quan điểm "Nhưng Page không SEO ta sẽ chặn index".

Khắc phục: Kiểm tra lại việc điều hướng con robots của Google

+Nhà cung cấp DNS động và máy chủ lưu trữ miễn phí gây ra spam

Trang web được lưu trữ bởi dịch vụ lưu trữ miễn phí hoặc nhà cung cấp DNS động chứa một phần đáng kể nội dung spam.

Chắc bạn đã thấy dạng SPAM Email ?. Điều gì sẽ xảy ra nếu nhà cung cấp dịch vụ phân giải tên miền cho những đơn vị sử dụng để SPAM, chèn virust, hoặc làm những tác vụ ảnh hưởng tới người dùng. Google lập tức sẽ chảm đơn vị này. Trường hợp gần đây nhất mà Tú biết là domain miễn phí .co.cc lừng danh một thời. Bạn sẽ chẳng bao giờ tìm thấy bất kỳ 1 domain nào .co.cc xuất hiện trên Google. Bạn cũng không cần quá lo lắng về máy chủ DNS phân giải tên miền, vì chúng rất hiếm gặp :D. 

Còn máy chủ thì bạn cần dựa vào dạng IP, nếu từ một IP một máy chủ nào đó bị Google chảm rất nhiều Website, rất có thể Google sẽ đưa IP này vào danh sách SPAM của mình. Những Website khi đặt máy chủ ở đây cũng có khả năng bị phạt, rất khó để biết được IP nào bị phạt một cách chính xác. 

Tuy nhiên bạn có thể xem WHOIS của domain, và xem danh sách những Website sử dụng chung Server đó rồi test rồi có thể chọn. 

VD: Các bạn có thể sử dụng công cụ miễn phí của WHOIS DOMAIN TOOLS . 

Để xem những Website cùng chung với Server của mình Reverse IP của http://reverseip.domaintools.com/search/?q=nguyencaotu.com 

Khắc phuc: Chuyển nhà cung cấp DNS domain của bạn, hoặc chuyển dữ liệu Website qua Server khác.

+Nội dung nghèo nàn có ít hoặc không có giá trị gia tăng

Có vẻ như trang web bao gồm các trang có chất lượng thấp hoặc hời hợt không cung cấp cho người dùng nhiều giá trị gia tăng (chẳng hạn như các trang liên kết nghèo nàn, trang ngõ, các trang web giống nhau hàng loạt, nội dung được tạo tự động hoặc nội dung được sao chép).

Mô tả của Google đã khá rõ ràng cho dạng này. Hãy cố gắng nâng cao điểm chất lượng cho nội dung của bạn. Có một anh trong một buổi hội thảo có show cho mình xem một Website toàn nội dung trùng lặp, và anh đó nghĩ vẫn có thể SEO được. 

Nhưng mình tin, site đó sẽ không thể sống được lâu. Có lẽ cũng là vì, anh ấy chỉ muốn SEO có 01 từ, còn website của chúng ta, liệu bạn chỉ muốn SEO 1 từ duy nhất ?.

+Liên kết bất thường từ trang web

Google đã phát hiện ra một mẫu các liên kết bất thường, nhân tạo, giả mạo hoặc nhằm mục đích thao túng xuất phát từ trang web này. Đây có thể là kết quả của việc bán liên kết mà PageRank chấp nhận hoặc tham gia vào các mưu đồ liên kết.

Khi bạn nhận được thông báo này, nó vẫn thường nằm ở dạng cảnh báo nhiều hơn là đã "phạt". Nó xuất hiện khi Website của bạn có quá nhiều liên kết ra bên ngoài, và sẽ bị tiêu diệt trong nay mai, nhất là khi các bạn đặt liên kết rất kém dạng (link, link, link...) Cách bạn mua Page Rank an toàn hơn là dựa vào nội dung một cách tự nhiên và có điều hướng. 

Có kiểm soát số lượng Link Out (<20 khi đi mua liên kết). Tỷ lệ đẹp hơn mà hiện khi mình đưa cho mọi người, mình thường kiểm sáo chúng < 10 liên kết. Nếu bạn cần tìm những nơi đặt link ở nội dung và có tỷ lệ thấp, bạn có thể contact với Tú. 

Khắc phục: Check lại website của mình, tiến hành tháo gỡ những Link liên kết ra bên ngoài, hoặc thêm thuộc tinh rel="nofollow" cho chúng. Bạn nên Tham khảo rel="nofollow" là gì để tìm hiểu về các dạng LINK và nofollow dùng đúng cách khi nào.

+Liên kết bất thường tới trang web

Google đã phát hiện ra một mẫu các liên kết bất thường, nhân tạo, giả mạo hoặc nhằm mục đích thao túng trỏ đến trang web. Đây có thể là kết quả của việc mua các liên kết mà PageRank chấp nhận hoặc tham gia vào các mưu đồ liên kết.

Liên kết bất thường tới trang web
Liên kết bất thường tới trang web

Liên kết bất thường này sẽ xảy ra khi bạn liên kết địa chỉ Website của bạn ở một hoặc nhiều Website khác, mà vị trí bạn gắt link (thường là cuối trang web - footer, bên phải website -right, bên trái website- left, trên slidebar..) mà bất kỳ một Page nào trong website bạn đặt, bạn đều có thể thấy liên kết của mình. 

Những liên kết này được tạo ra một cách tự động và anchortext chúng không thay đổi, nếu một tỷ lệ đủ lớn bạn sẽ mau chóng nhận được thông báo. Google rất ghét việc thao túng Page Rank, nếu bạn muốn quảng bá Webstie của mình, hãy thêm thuộc tính rel="nofollow" cho liên kết của bạn 

Khắc phục: Hãy liên hệ với củ Website bạn liên kết, nếu không thể được ta có thể dùng công cụ từ chối liên kết của Google mang tên Google-Disavow . Tham khảo hướng dẫn sử dụng Google-Disavow hiệu quả.

+Spam do người dùng tạo

Có vẻ trang web chứa nội dung spam do người dùng tạo. Nội dung có vấn đề có thể xuất hiện trên các trang diễn đàn, các trang lưu bút hoặc tiểu sử người dùng.

Cuốic ùng là việc bạn trả lời bài viết trên diễn đàn, trả lời ở các comment của Blog bạn có chèn liên kết của mình bên dưới. Thường là sử dụng những phần mềm tự động post bài, tự động up bài, hay tự động comment trên wordpress, blogger.... hãy dừng lại trước khi quá muộn nếu bị phạt, những liên kết này vì thế ngày càng kém giá trị hơn và mang lại cho bạn hiệu quả thấp hơn.

 Khắc phục: Có thể xử lý được bằng Google-Disavow, hoặc tự bạn có thể gỡ những link kém chất lượng.

Điều gì sẽ xảy ra khi Website của bạn bị phạt SPAM GOOGLE.

Đừng khiếu nại ngay lập tức, hãy kiểm tra Website của bạn xem mình vi phạm "Nguyên tắc quản trị trang web" kể trên để xử lý. Nếu như bạn khiếu nại ngay lập tức mà chưa giải quyết được vấn đề, yêu cầu xem xét của bạn sẽ không đượ thực hiện. Hãy xem xét kỹ lại vấn đề bạn gặp phải, sau đó cố gắng giải quyết vấn đề kể trên. 

Những dạng SPAM GOOGLE phổ biến mà Tú Cao đề cập tất cả trong bài viết bên trên. Hãy kiểm tra thật kỹ vấn đề mà bạn gặp phải, thậm chí còn phải xem xét lại việc tối ưu on-site Webite của mình tốt hay chưa ( Thế nào là một Website chuẩn SEO , chuẩn ON Site) Trong bài kế tiếp Tú sẽ chia sẻ với mọi người quá trình xử lý Website bị Sanbox (nên đập hay nên giữ) và cách các bạn gửi đơn để kiểm duyệt được nhanh chóng. 

Mình đã xử lý thành công 02 Website bị cảnh báo SPAM tác vụ thủ công, một website biến mất hoàn toàn bởi Google và một website đã bị gửi thư cảnh cáo về "Liên kết bất thường tới trang web" chỉ mất trong 03 ngày. Và hiện cả 2 Website đều hoạt động rất ổn định. 

Ghi chú: Bài viết có sử dụng lại một số thông tin trích dẫn, hình ảnh của Google (Xem chi tiết) Những đợt quét của Google mình cảm thấy rất vui, vì khi đó mọi người đã công bằng hơi với nhau. Để chúng ta thực sự mang lại giá trị cho người dùng. Cám ơn bạn đã theo dõi bài viết.

Tú Cao
Tác giả Tú Cao Admin

"Hạnh phúc không phải là nhận, hạnh phúc chính là sự cho đi" - đây là lý do Tú xây dựng Blog này. Bài viết trên dự dựa trên quan điểm, hiểu biết của cá nhân. Nó có thể đúng, cũng có thể sai tùy thời điểm, vì vậy bạn phải tự cân nhắc và chịu trách nhiệm khi làm theo. Nếu bạn thấy nội hữu ích với bạn, hãy Mời Tú Cao một tách CÀ PHÊ.

Bài viết trước Cách Google thu thập thông tin và xếp hạng thứ hạng từ khóa

Cách Google thu thập thông tin và xếp hạng thứ hạng từ khóa

Bài viết tiếp theo

Hướng dẫn cập nhật extension trên Chrome của Google

Hướng dẫn cập nhật extension trên Chrome của Google
Viết bình luận
Thêm bình luận

13 Bình luận

V
Văn Việt

Anh ơi, blog của em bây giờ khi chia sẻ lên google+ thì bị báo là vi phạm chính sách,...và phải chờ xét duyệt mới có thể đăng. Anh có cách khắc phục nào không a? Em bị vị phạm do copy 1 bài viết từ blog khác.

Trả lời
15:43 30/07/2014
C
vu cong

Tú ơi, cậu có thể giúp mình cái website của mình được không? Không biết xử lý kiểu gì nữa, bị spam thủ công, mình đã disavow rất nhiều rồi nhưng vẫn không được, lượt truy cập mỗi ngày một giảm, từ khóa mỗi ngày một mất đi.

Trả lời
00:31 22/05/2014
N
Giang Ngô

A ơi website của e bị google áp dụng hình thức phạt thủ công, Bọn e đã nổ lực gỡ bỏ link sai phạm cả hơn tháng nay thậm chí là xóa gần hết các link mà vẫn không được. Vậy anh có thể cho e hướng giải quyết được không ạ? Nếu được anh có thể giải quyết luôn cho bọn em với. Chúng e không thể bỏ cả 3 site xây dựng 2 năm nay được. Xin cảm ơn anh rất nhiều.0989330865 đây là số điện thoại của em rất mong được anh tư vấn vì e ko biết số của anh nên không thể gọi được. Hoặc anh có thể gửi qua email cho em : hoangvietcntt@gmail.com

Trả lời
10:16 19/05/2014
P
Nguyễn Phúc

Bạn tú ơi mình đang bị tác vụ thủ công gửi 2 lần rồi không thành công, bạn giúp mình với nhé. Yh : duyduc.seller01 mong nhận được sự giúp đỡ từ bạn

Trả lời
08:27 03/04/2014
T
Nguyễn Tuấn

Mặc dù ko hiểu biết nhiều về SEO như cậu, nhưng qua những chia sẻ của cậu bạn cùng khóa, mình thấy Tú rất chuyên nghiệp (tình cờ qua link vào website cậu). Chúc cậu bạn thành công trên con đường đã chọn ! :))

Trả lời
22:47 10/03/2014
Popup image default

Bài viết liên quan

Thông báo