Поисковые боты Googlebot способны, без каких либо трудностей, сканировать большинство типов файлов. Ниже представлен перечень наиболее распространенных из них:
| Adobe PDF (*.pdf) | кроссплатформенный формат электронных документов |
| Adobe PostScript (*.ps | файл языка программирования PostScript или языка разметки страниц |
| Autodesk Design Web Format (*.dwf) | безопасный формат файлов для обмена проектными данными для печати, просмотра или рецензирования |
| Код Basic (*.bas) | формат файла языка программирования Basic |
| Код C/C++ (*.c, *.cpp, *.cxx, *.h, *.hpp) | форматы файлов языков программирования C и C++ |
| Flash (*.swf) | стандартное расширения для Flash-файлов |
| Google (*.kml, *.kmz) | язык разметки для представления трехмерных геоданых в программе Google Earth |
| HTML (*.htm, *.html) | файлы стандартной разметки документов в интернете |
| Perl (*.pl) | файлы языка программирования Perl |
| Python (*.py) | файл исходного кода программ высокоуровневого языка программирования Python |
| Java (*.java) | исходный код языка программирования Java |
| Microsoft Exel (*.xls, xlsx) | формат стандартных рабочих книг Exel |
| Microsoft PowerPoint (*.ppt, *.pptx) | формат файлов для программы создания презентаций PowerPoint |
| Microsoft Word (*.doc, *.docx) | формат файлов текстового редактора Word |
| OpenOffice (*.odt) | формат файлов текстового редактора в OpenOffice |
| OpenOffice (*.odp) | формат файлов для программы создания презентаций в OpenOffice |
| OpenOffice (*.ods) | формат стандартных рабочих книг электронных таблиц в OpenOffice |
| Текстовые форматы (*.rtf, *.wri, *.ans, *.asc, *.cas, *.txt, *.text | текстовые форматы |
| XML (*.xml) | файл расширяемого языка разметки XML |
| (*.wml, *.wap) | файлы разметки для беспроводных устройств. |
Если в поиске использовать оператор filetype (например, filetype:xml ноутбук), то в результатах будут только файлы расширения *.xml, при этом в результатах не будет файлов типа XML. Некоторые страницы вообще не имеют расширения (например, http://excalibur.com.ua). Иногда расширения страницы не соответствует типу файла.
Поисковые боты Yandex bot способны, без каких либо трудностей, сканировать большинство типов файлов. Ниже представлен перечень наиболее распространенных из них:
| Microsoft Word (*.doc, *.docx) | формат файлов текстового редактора Word |
| Adobe PDF (*.pdf) | кроссплатформенный формат электронных документов |
| Flash (*.swf) | стандартное расширения для Flash-файлов |
| Microsoft Exel (*.xls, xlsx) | формат стандартных рабочих книг Exel |
| Microsoft PowerPoint (*.ppt, *.pptx) | формат файлов для программы создания презентаций PowerPoint |
| OpenOffice (*.odt) | формат файлов текстового редактора в OpenOffice |
| OpenOffice (*.odp) | формат файлов для программы создания презентаций в OpenOffice |
| OpenOffice (*.ods) | формат стандартных рабочих книг электронных таблиц в OpenOffice |
| Текстовые форматы (*.rtf, *.txt) | текстовые форматы |
Примечание. В документах типа PDF индексируются только текст, картинки нет. Во Flash к индексации допускается текст в блоках:
,а ссылки в блоках:
Документы размером свыше 10Мб не индексируются.