Metrics and groups/ru: Difference between revisions
(Created page with "В норме браузер не врёт о себе. Есть разумеется исключения, вроде тех же расширений, которые помогают изменить user agent, или мобильных браузеров или приложений, в которых зашит неизменный user agent, потому что разработчики ленятся его менять. Но такие случаи можно иг...") |
(Created page with "=== Общие метрики === {| class="wikitable" |- ! Название !! Название !! Описание |- | Hits || Переходы || Общее количество проверок |- | Unique users || Уники || Количество уникальных пользователей, подсчитанное на основе IP и user agent |- | Good || Хорошие переходы || Количество проверок, по результат...") |
||
Line 14: | Line 14: | ||
Метрики — это параметры, которые позволяют ответить на вопрос «сколько?». Сколько было заходов на сайт? Сколько из них было совершено ботами, а сколько живыми пользователями? | Метрики — это параметры, которые позволяют ответить на вопрос «сколько?». Сколько было заходов на сайт? Сколько из них было совершено ботами, а сколько живыми пользователями? | ||
=== Общие метрики === | |||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
! | ! Название !! Название !! Описание | ||
|- | |- | ||
| Hits || | | Hits || Переходы || Общее количество проверок | ||
|- | |- | ||
| Unique users || | | Unique users || Уники || Количество уникальных пользователей, подсчитанное на основе IP и user agent | ||
|- | |- | ||
| Good || | | Good || Хорошие переходы || Количество проверок, по результату которых переход оказался не ботовым, не подозрительным и не тех. потерей. | ||
|- | |- | ||
| Tech. losses || | | Tech. losses || Тех. потери || Количество переходов, которые мы не смогли проверить. Причины — браузеры с отключённым JS, устаревшие браузеры и пр. | ||
|} | |} | ||
=== Боты (BV, bot visits) === | |||
Бот — это программа или автоматизированный скрипт, который запрашивает веб-контент (включая цифровую рекламу) без участия пользователя. Это может быть например браузер на заражённом компьютере, являющимся частью ботнета. Или написанный программистом скрипт, который обходит сайты с какой-то целью. | |||
<div lang="en" dir="ltr" class="mw-content-ltr"> | <div lang="en" dir="ltr" class="mw-content-ltr"> |
Revision as of 10:10, 18 September 2023
User agent
User agent — это заголовок, который браузер, программа или приложение передают серверу при любом заходе на сайт. В user agent содержится как правило название браузера, его версия, движок на основе которого сделан браузер, операционная система и её версия. Так же user agent может содержать название и модель мобильного устройства, на котором он запущен и некоторую другую информацию. То есть это визитная карточка браузера.
Проблема в том, что эту визитную карточку очень легко подделать — с помощью расширений или даже просто в DevTools. Практически в любом языке программирования есть возможность при обращении к серверу передать в user agent любую информацию. Поэтому к user agent надо относиться с осторожностью.
В норме браузер не врёт о себе. Есть разумеется исключения, вроде тех же расширений, которые помогают изменить user agent, или мобильных браузеров или приложений, в которых зашит неизменный user agent, потому что разработчики ленятся его менять. Но такие случаи можно игнорировать — они либо единичны, либо их можно добавить в исключения.
Другое дело, когда переданная информация не соответствует тому, что мы узнали о браузере в результате проверки, и этот паттерн превалирует на срезе — по user agent мы видим разнообразие браузеров, а анализ показывает, что это всё заходы с одного и того же браузера.
Поэтому user agent является «ненадёжным расказчиком» и к информации, которую мы добываем из него надо относиться со здоровой долей скептицизма.
Метрики
Метрики — это параметры, которые позволяют ответить на вопрос «сколько?». Сколько было заходов на сайт? Сколько из них было совершено ботами, а сколько живыми пользователями?
Общие метрики
Название | Название | Описание |
---|---|---|
Hits | Переходы | Общее количество проверок |
Unique users | Уники | Количество уникальных пользователей, подсчитанное на основе IP и user agent |
Good | Хорошие переходы | Количество проверок, по результату которых переход оказался не ботовым, не подозрительным и не тех. потерей. |
Tech. losses | Тех. потери | Количество переходов, которые мы не смогли проверить. Причины — браузеры с отключённым JS, устаревшие браузеры и пр. |
Боты (BV, bot visits)
Бот — это программа или автоматизированный скрипт, который запрашивает веб-контент (включая цифровую рекламу) без участия пользователя. Это может быть например браузер на заражённом компьютере, являющимся частью ботнета. Или написанный программистом скрипт, который обходит сайты с какой-то целью.
Name | Description |
---|---|
BV total | Number of clicks made by bots of all types. |
Crawler | Legitimate bots that honestly declare their botness through the user agent. These could be search engine bots indexing the web, social media bots, etc. Despite not having malicious intent, they cannot convert and are not the target audience, so they should be ignored. |
Spoofing | Bots whose user agent does not match the actual browser version and/or operating system. |
Automated | Bots using headless browsers or automation tools like Selenium. The original purpose of such solutions is to automate software, website, application testing, etc. Then bot operators realized they could also use them for click fraud, view fraud, etc., and added them to their inventory. |
iFrame | During the analysis, we found that the page is located on the site in a small or inconspicuous element. That is, the impression will be counted, but the real user will not see, for example, the ad and will never be able to click on it. |
Suspicious visits (SV)
We see something suspicious in the analysis results, but it is not enough to confidently state that it is a bot. Possible reasons include the user having a harmless extension that somehow affects our checks, or the user accessing through a VPN.
Suspicious clicks require an individual approach, for example, to determine where to attribute suspicious traffic based on conversions - to fraudulent or good traffic.
Name | Description |
---|---|
SV total | Number of suspicious clicks. |
Proxy | Users accessing through VPN, proxy, or Tor. These are live clicks, but they come from non-targeted geo. If you are buying traffic from a specific geo, and there are a lot of proxies on it, then the traffic is bad. |
Suspicion of spoofing | We suspect that user agent spoofing techniques are being used in the browser. If this metric is low, there is nothing to worry about. But if its percentage is high and you are not buying any specific mobile traffic, then there is a reason to think about it. |
Suspicion of automated | We suspect that automation tools are being used in the browser. |
Suspicion of fraud | Other types of suspicious activity, such as a too-wide screen, can be the result of poor layout or an attempt to hide ads outside the screen. |
Feature
Some browser features that we detect.
Name | Description |
---|---|
AdBlock | Whether AdBlock is installed in the user's browser or not. Note that we only check for the presence of AdBlock; whether it is turned on or off is not checked. |
Is mobile | Checking by characteristic features (not by user agent) whether the device is mobile (smartphones, tablets) or not (desktops, TVs). |
WebView | Number of visits with Chrome WebView. Chrome WebView is a greatly reduced functionality version of mobile Chrome that is used in apps to view web pages, as well as many mobile browsers for Android, which are customized WebView. Most WebViews cannot display pushes. Therefore, if there is a high percentage of WebView on push traffic, the traffic may be bad. |
IFrame | Number of visits made via iframe. <iframe> tag HTML element represents a nested browsing context, embedding another HTML page into the current one. |
Push notifications | Number of visits from browsers that support push notifications. |
Groups
Groups are parameters that allow you to answer the question "which?". From which countries were the clicks? Which browsers did users use?
Time
Name | Description |
---|---|
Hour | Groups statistics by hours. |
Day | Groups statistics by days. |
Week | Groups statistics by weeks. |
Month | Groups statistics by months. The maximum period that can be selected is two months. |
Tags
Name | Description |
---|---|
Integration | Kaminari integration ID. |
Bot type | Grouping by bot types. |
Referer | URL of the page from which the user landed on the page. |
Sub1..Sub7 | Tags set by the client. |
Geo
Name | Description |
---|---|
Language | User's preferred language, i.e. UI language set in the browser settings. |
Timezone | Browser time zone, actually the user's operating system time zone. |
Country | Country data obtained from IP address. |
City | City data obtained from IP address. |
Provider | Internet service provider data obtained from IP address. |
Device
Name | Description |
---|---|
Browser | Browser name and version taken from user agent. |
Browser engine | All modern browsers are based on three open-source engines:
There are also three old unsupported engines that are still present on the internet in the form of Internet Explorer, in MS Edge up to version 18 and in Opera up to version 12. We can determine all 6 engines by their characteristic features, as well as determine the specific version of the engine. It is the browser engine that we write this data to. |
OS | Operating system and its version taken from user agent. |
Real OS | The current OS without version. |
Device | Mobile device manufacturer obtained from user agent. |
Device type | Device type (desktop, smartphone, smart TV, etc.) obtained from user agent. |
Connection type | The type of connection that the device uses to connect to the network (Bluetooth, Wi-Fi, mobile internet). |
Экран
Название | Название | Описание |
---|---|---|
Screen width | Ширина экрана | Ширина экрана в пикселях. |
Screen height | Высота экрана | Высота экрана в пикселях. |
Screen orientation | Ориентация экрана | Ориентация экрана актуальна для мобильных устройств — портретная, вверх ногами, повёрнуто влево, повёрнуто вправо. |
Pixel density | Плотность пикселей | Сколько экранных пикселей будет использовано для отрисовки одного CSS-пикселя, то есть фактически это разрешение экрана. |