Google là một cơ sở dữ liệu cực kỳ hữu ích của các trang web được lập chỉ mục, nhưng truy vấn Google không tìm kiếm những gì bạn nhập theo nghĩa đen. Các thuật toán đằng sau các tìm kiếm của Google có thể dẫn đến rất nhiều kết quả không liên quan. Tuy nhiên, với các toán tử phù hợp,

Nếu bạn đã từng tìm kiếm câu trả lời cho câu hỏi lập trình và thấy mình bị chôn vùi trong kết quả không hiệu quả hoặc cố gắng tìm kiếm ai đó có cùng tên với người nổi tiếng, bạn có thể đã gặp một số thiếu sót của Google. Bởi vì Google theo mặc định không tìm kiếm các từ theo nghĩa đen mà bạn nhập, nên việc kết thúc với hàng tấn kết quả không liên quan là phổ biến

Các loại tìm kiếm Google

Có rất nhiều điều Google làm tốt, nhưng tìm kiếm một số loại câu trả lời nhất định phơi bày những sai sót này khá rõ ràng. Nếu chúng tôi đang cố gắng tìm hiểu tại sao chúng tôi gặp lỗi Python, bạn có thể thấy ngay tại sao những kết quả tìm kiếm này có thể không hữu ích.

Các loại tìm kiếm Google

Rất tiếc! Đối với tìm kiếm về một thư viện được cập nhật tích cực, một bài viết từ năm 2014 có cơ hội ít ỏi vẫn hoạt động như được mô tả vào năm 2019.

Một vấn đề khác xuất hiện khi chúng ta bắt đầu cố gắng tìm kiếm các thuật ngữ lập trình và kỹ thuật có thể có ý nghĩa khác, phổ quát hơn. Nếu những gì chúng tôi đang tìm kiếm là tính năng danh sách tiêu chuẩn của C ++, thì truy vấn sẽ là “std :: list”. Tìm kiếm điều này tạo ra nhiều kết quả khó chịu và không liên quan vì Google bỏ qua “::” và trả về một danh sách các bệnh lây truyền qua đường tình dục.

Các loại tìm kiếm Google

Nhìn chằm chằm vào một màn hình đầy những kết quả khó hiểu có thể làm nản chí. Tuy nhiên, chúng ta vẫn có thể dọn sạch các tìm kiếm này bằng cách hiểu cách Google tìm thông tin và sử dụng các toán tử để tìm hiểu chính xác những gì chúng ta muốn tìm. Sử dụng các toán tử này có thể giảm đáng kể thời gian cần thiết để tìm ra kết quả mà bạn đang cố gắng đào lên.

Những gì bạn cần

Đối với hướng dẫn này, bạn sẽ chỉ cần một trình duyệt được kết nối với internet và truy cập Google. Chúng tôi sẽ định vị thông tin về các mục tiêu khó tìm kiếm, vì vậy, mục tiêu này sẽ hoạt động trên mọi hệ điều hành miễn là bạn có thể chạy các tìm kiếm của Google.

Dưới đây, bạn có thể thấy danh sách các toán tử tìm kiếm mà chúng tôi sẽ sử dụng để tìm hiểu dữ liệu.

Các loại tìm kiếm Google

Bằng việc sử dụng các nhà điều hành phù hợp với các vấn đề đúng, chúng ta có thể cắt giảm số lượng thời gian chúng tôi phải bỏ ra nhìn vào kết quả không liên quan. Bạn có thể tìm thấy một danh sách các toán tử tìm kiếm tài liệu của Google tại đây .

Bước 1 Tìm kết quả lập trình liên quan

Khi bạn đang tìm kiếm truy vấn xoay quanh các phần mềm, một trong những điều quan trọng nhất để xem xét là thời gian. Khi một cái gì đó đã được công bố là rất quan trọng cần xem xét khi quyết định nếu một câu trả lời rất hữu ích, đến nỗi nó không hữu ích bao gồm bất kỳ kết quả đó là quá xa bên ngoài phạm vi hữu ích.

Cân nhắc tìm kiếm câu trả lời về Python, một ngôn ngữ lập trình phổ biến. Python liên tục thay đổi và được cập nhật, và có nhiều phiên bản được sử dụng ngày hôm nay. Do đó, thông tin về nó đã được xuất bản một thập kỷ trước sẽ cực kỳ lỗi thời và rất có thể không chính xác – đặc biệt nếu bạn đang sử dụng phiên bản được phát hành gần đây hơn.

Điều đầu tiên bạn nên xem xét khi tìm kiếm câu trả lời cho câu hỏi kỹ thuật là khi một bài viết quá cũ không hữu ích. Bằng cách đặt bộ lọc bỏ qua mọi thứ quá cũ là hữu ích, chúng tôi có thể dễ dàng giới hạn các tìm kiếm của mình ở các kết quả có liên quan. Ngược lại, nếu chúng ta cần tra cứu câu trả lời phần mềm cho thư viện cũ hoặc phiên bản cũ hơn của phần mềm bạn đang làm việc, chúng ta có thể giới hạn tìm kiếm của mình đối với kết quả được công bố trước một ngày cụ thể – giả sử, khi phiên bản mới hơn được phát hành.

Có hai cách để làm điều này. Đầu tiên là nhấp vào tùy chọn “công cụ” và sau đó “bất kỳ lúc nào” và chọn “năm ngoái”. Thứ hai là chỉ định một ngày để tìm kết quả trước hoặc sau. Định dạng cho cái này là trước: ngày và sau: ngày . Bạn có thể xem ví dụ về các tùy chọn “bất kỳ lúc nào” và “trước” được sử dụng bên dưới.

Các loại tìm kiếm Google

Ngày xuất bản chỉ là một phần của câu đố. Chúng tôi cũng có thể xâu chuỗi các nhà khai thác với nhau để chỉ định nguồn dữ liệu của chúng tôi. Nếu chúng tôi tìm kiếm “Scacco_Exception”, kết quả đầu tiên đã hết hạn và các kết quả khác là từ các nguồn có thể không có uy tín.

Giả sử chúng tôi chỉ muốn nhận câu trả lời từ các nguồn chất lượng cao hoặc ít nhất là các nguồn mà chúng tôi mong đợi sẽ không tạo ra rác. Chúng tôi có thể chọn số lượng trang web để thêm vào danh sách theo ý muốn với trang web: toán tử và toán tử OR để xâu chuỗi chúng lại với nhau.

Bằng cách thêm sau: 2018 vào chuỗi, chúng tôi sẽ chỉ tìm thấy kết quả sau năm 2018 được công bố trên các trang web này.

Các loại tìm kiếm Google

Bây giờ, kết quả chúng tôi thấy là từ các nguồn chúng tôi muốn và giới hạn ở những ngày hữu ích.

Bước 2 Xóa kết quả không mong muốn

Giả sử chúng ta cần xóa các kết quả tìm kiếm không mong muốn, sử dụng ví dụ về danh sách std: chúng ta có thể sử dụng để loại bỏ các kết quả có chứa các cụm từ chính không có trong kết quả mà chúng ta muốn.

Khi chúng ta đang xử lý các từ viết tắt, cách hiệu quả nhất để làm điều này là loại bỏ các kết quả có chứa các từ trong cách hiểu sai. Ví dụ: thêm một truyền đơn giản là đủ để dọn sạch tìm kiếm từ trước đó.

Các loại tìm kiếm Google

Chúng tôi cũng có thể xóa sạch các kết quả này bằng cách loại bỏ các trang web khỏi kết quả gây ra nhiều kết quả sai. Tại đây, chúng tôi có thể nhận được kết quả tương tự bằng cách xóa ba trang web hàng đầu cho chúng tôi kết quả không liên quan.

Các loại tìm kiếm Google

Cả hai phương pháp đều hiệu quả để loại bỏ các kết quả đang làm lộn xộn tìm kiếm của bạn.

Bước 3 Xác định tệp trên các miền cụ thể

Chúng tôi có thể tìm kiếm cho các tập tin có thể được thú vị bằng cách kết hợp các trang web và filetype điều hành, cho phép chúng ta có thể tìm thấy các file mà không được phải được công khai. Để thu thập các tài liệu chính thức, PDF là một định dạng tuyệt vời để thử đào lên.

Ở đây, chúng tôi tìm kiếm những miền spacex.com cho bất kỳ tập tin PDF mà nhắc đến từ “nội bộ” để cố gắng tìm các tài liệu có thể cung cấp cho chúng ta manh mối thành các thủ tục nội bộ của họ.

Các loại tìm kiếm Google

Bạn có thể thay thế PDF bằng PPTX cho powerpoint, DOCX cho các tệp từ và các định dạng khác mà bạn có thể thấy thú vị. Nếu bạn có một danh sách nhiều tên miền để tìm kiếm, bạn có thể xâu chuỗi chúng cùng với toán tử OR để tìm kiếm nhiều trang web cho các tệp.

Bước 4 Sử dụng mọi thứ với Tìm kiếm nâng cao

Mặc dù không dễ dàng như chỉ cần đưa một nhà điều hành vào một tìm kiếm tiêu chuẩn, bạn luôn có thể truy cập các tùy chọn này trong bố cục đồ họa bằng cách điều hướng đến trang tìm kiếm nâng cao của Google .

Trang tìm kiếm nâng cao sẽ cho phép bạn sử dụng bất kỳ kết hợp toán tử nào để tạo tìm kiếm có cấu trúc. Nó chủ yếu hữu ích để tham khảo, vì bạn chỉ có thể sử dụng một vài trong số các toán tử này cho bất kỳ tìm kiếm cụ thể nào.

Các loại tìm kiếm Google

Một số tùy chọn hữu ích ở đây cũng là ngôn ngữ và khu vực, tùy thuộc vào nghiên cứu bạn đang thực hiện, có thể hữu ích để lọc kết quả của bạn đến một khu vực cụ thể hoặc tìm tài liệu bằng ngôn ngữ cụ thể.

Tìm kiếm của Google có thể nhanh hơn rất nhiều với các nhà khai thác phù hợp

Bằng cách xâu chuỗi các toán tử tìm kiếm khác nhau, có thể tìm kiếm đầy đủ các kết quả không liên quan và cắt nó xuống để trả lời hoàn hảo. Kỹ năng này hữu ích không chỉ cho tin tặc mà cho bất kỳ ai cần tìm kiếm các câu hỏi nhạy cảm về thời gian về công nghệ hoặc phần mềm. Một phiên bản tiên tiến hơn của này, Google Dorking, cho phép chúng ta tìm kiếm cho các hệ thống dễ bị tổn thương bằng cách sử dụng các toán tử tìm kiếm để xác định vị trí các chuỗi văn bản trên các trang tiếp xúc, mà chúng ta sẽ khám phá trong bài viết tiếp theo của chúng tôi về việc sử dụng Google để tra OSINT.

Để lại một bình luận