비디오: ì í, 802.11n 무ì ë¤í¸ìí¬ ë°±ì ë°ì¤ãíì캡ìãì ë´¬ (12 월 2024)
뉴스를 얻기 위해 Google 뉴스를 자주 스캔합니다. Google 뉴스는 "로봇"이 결정한 내용에 따라 전 세계의 기사를 집계합니다. 트렌드에 관한 모든 것입니다. 그것은 일반적으로 속보를 그리워하고 내 칼럼과 같은 중요한 논평을 완전히 무시합니다. 대신, 죽은 링크를 선호하는 것 같습니다. 즉, 월스트리트 저널 (Wall Street Journal )을 의미합니다. 구독하려면 구독이 필요합니다.
오늘날이 그 예입니다. CES에서 접시 네트워크가 Clearwire를 사기 위해 입찰하는 것에 관한 뉴스 속보가있었습니다. 그러나 Google은 무료로 읽을 수있는 웹 사이트를 통해 관련 기사를 연결하는 대신 월스트리트 저널 에서 주요 기사를 작성하기로 결정했습니다.
과거에 구글은 사용자가 페이 월에 의해 차단되기 전에 최소한 리드 단락이나 전체 기사를 읽을 수 있도록하는 일종의 거래를 가졌습니다. 바이 패스 트릭을 알지 못하면 (아래에 설명) 더 이상 적용되지 않습니다. 이제 당신은 paywall에 빠져 완료되었습니다. 나는 실제 가입자가 이것을 지나친다고 생각하지만 구글 봇이 어떻게 이야기를 찾아야하는지 궁금합니다. Google은 유료입니까? 나는 그것을 의심한다. 따라서 Google 봇에는 일종의 백도어가 있어야합니다.
이것은 가짜이며 Google 사용자에게 서비스를 제공하지 않습니다. 구글은 시스템을 게임하려는 사람들을 물리 치기 위해이 모든 어려움을 겪지 만 월스트리트 저널은 이 스턴트를 끌어낼 수 있을까? 이것은 기본적으로 월스트리트 저널 구독에 대한 지불입니다. Google이 원하는 것입니까? 구글은 상처를 받고 있습니까?
구글이 단순히 이러한 성가심을 고치는 것은 그리 어렵지 않습니다. 1 분 (5 분)이 소요됩니다. 너무 많은 일입니까?
회사에 서비스에 내장 된 페이 월이있는 경우 Google은 사이트를 전혀 검색하지 않아야합니다. 봇은 페이 월이 있다는 것을 알고 검색을 피해야합니다. 그렇습니다. 봇이 Paywall에 의해 차단 된 사이트를 정확하게 검색 할 수있는 방법에 대한 설명을 원합니다. 미스터리입니다.
페이 월은 크롤러 로봇이 사라지도록 "robots.txt"와 정확히 같아야합니다. 그러나 WSJ- Google 관계에 대해 뭔가 비린내가 있습니다. 모든 봇을 죽이는 가장 쉬운 방법은 robots.txt 파일의 메타 태그입니다. .
WSJ는 대신 특정 하위 디렉토리를 구체적으로 차단하지만 전부는 아닙니다. 그리고 더 이상하게도, 구글 뉴스에서 똑같은 기사를 검색하면 런 다운에서 링크를 클릭하는 대신 다른 메커니즘을 통해 기사를 얻는다.
WSJ가 사용하는 robots.txt 파일을 검사하여이 두 기술에 대해 잘 알고있는 독자들에게 도전합니다. 공개 문서는 여기에 있습니다.
어떤 경우 든 사이트에는 재정적 인 이유로 월급이 있습니다. 콘텐츠로 게임을하고 싶은 경우는 있지만 Google이 시스템 게임을 시도하는 사람들을 방해하는 것과 같은 방식으로 검색 결과에서 금지되어야합니다. Google은 일부 스케치 동작을 위해 모자를 떨어 뜨리는 순간 블로거를 금지합니다. 더 큰 사이트를 같은 방식으로 처리하는 것은 어떻습니까?
트위터 @therealdvorak에서 John C. Dvorak을 팔로우 할 수 있습니다.
더 많은 John C. Dvorak:
John C. Dvorak과의 주제에서 벗어나십시오.
갤러리의 모든 사진보기