Metrics and groups/ru: Difference between revisions

From Wiki Kaminari Click
(Created page with "В норме браузер не врёт о себе. Есть разумеется исключения, вроде тех же расширений, которые помогают изменить user agent, или мобильных браузеров или приложений, в которых зашит неизменный user agent, потому что разработчики ленятся его менять. Но такие случаи можно иг...")
 
(Created page with "=== Общие метрики === {| class="wikitable" |- ! Название !! Название !! Описание |- | Hits || Переходы || Общее количество проверок |- | Unique users || Уники || Количество уникальных пользователей, подсчитанное на основе IP и user agent |- | Good || Хорошие переходы || Количество проверок, по результат...")
Line 14: Line 14:
Метрики — это параметры, которые позволяют ответить на вопрос «сколько?». Сколько было заходов на сайт? Сколько из них было совершено ботами, а сколько живыми пользователями?
Метрики — это параметры, которые позволяют ответить на вопрос «сколько?». Сколько было заходов на сайт? Сколько из них было совершено ботами, а сколько живыми пользователями?


<div lang="en" dir="ltr" class="mw-content-ltr">
=== Общие метрики ===
=== General metrics ===
{| class="wikitable"
{| class="wikitable"
|-
|-
! Name !! Description
! Название !! Название !! Описание
|-
|-
| Hits || Total number of checks.
| Hits || Переходы || Общее количество проверок
|-
|-
| Unique users || Number of unique users counted based on IP and user agent.
| Unique users || Уники || Количество уникальных пользователей, подсчитанное на основе IP и user agent
|-
|-
| Good || Number of checks resulting in non-bot, non-suspicious, and non-technical loss traffic.
| Good || Хорошие переходы || Количество проверок, по результату которых переход оказался не ботовым, не подозрительным и не тех. потерей.
|-
|-
| Tech. losses || Number of clicks that we couldn't verify. Reasons include browsers with disabled JS, outdated browsers, etc.
| Tech. losses || Тех. потери || Количество переходов, которые мы не смогли проверить. Причины — браузеры с отключённым JS, устаревшие браузеры и пр.
|}
|}
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
=== Боты (BV, bot visits) ===
=== Bot visits (BV) ===
Бот — это программа или автоматизированный скрипт, который запрашивает веб-контент (включая цифровую рекламу) без участия пользователя. Это может быть например браузер на заражённом компьютере, являющимся частью ботнета. Или написанный программистом скрипт, который обходит сайты с какой-то целью.
A bot is a program or automated script that requests web content (including digital advertising) without user involvement. It could be, for example, a browser on an infected computer that is part of a botnet, or a script written by a programmer that scrapes websites for some purpose.
</div>


<div lang="en" dir="ltr" class="mw-content-ltr">
<div lang="en" dir="ltr" class="mw-content-ltr">

Revision as of 10:10, 18 September 2023

Версия на русском языке

User agent

User agent — это заголовок, который браузер, программа или приложение передают серверу при любом заходе на сайт. В user agent содержится как правило название браузера, его версия, движок на основе которого сделан браузер, операционная система и её версия. Так же user agent может содержать название и модель мобильного устройства, на котором он запущен и некоторую другую информацию. То есть это визитная карточка браузера.

Проблема в том, что эту визитную карточку очень легко подделать — с помощью расширений или даже просто в DevTools. Практически в любом языке программирования есть возможность при обращении к серверу передать в user agent любую информацию. Поэтому к user agent надо относиться с осторожностью.

В норме браузер не врёт о себе. Есть разумеется исключения, вроде тех же расширений, которые помогают изменить user agent, или мобильных браузеров или приложений, в которых зашит неизменный user agent, потому что разработчики ленятся его менять. Но такие случаи можно игнорировать — они либо единичны, либо их можно добавить в исключения.

Другое дело, когда переданная информация не соответствует тому, что мы узнали о браузере в результате проверки, и этот паттерн превалирует на срезе — по user agent мы видим разнообразие браузеров, а анализ показывает, что это всё заходы с одного и того же браузера.

Поэтому user agent является «ненадёжным расказчиком» и к информации, которую мы добываем из него надо относиться со здоровой долей скептицизма.

Метрики

Метрики — это параметры, которые позволяют ответить на вопрос «сколько?». Сколько было заходов на сайт? Сколько из них было совершено ботами, а сколько живыми пользователями?

Общие метрики

Название Название Описание
Hits Переходы Общее количество проверок
Unique users Уники Количество уникальных пользователей, подсчитанное на основе IP и user agent
Good Хорошие переходы Количество проверок, по результату которых переход оказался не ботовым, не подозрительным и не тех. потерей.
Tech. losses Тех. потери Количество переходов, которые мы не смогли проверить. Причины — браузеры с отключённым JS, устаревшие браузеры и пр.

Боты (BV, bot visits)

Бот — это программа или автоматизированный скрипт, который запрашивает веб-контент (включая цифровую рекламу) без участия пользователя. Это может быть например браузер на заражённом компьютере, являющимся частью ботнета. Или написанный программистом скрипт, который обходит сайты с какой-то целью.

Name Description
BV total Number of clicks made by bots of all types.
Crawler Legitimate bots that honestly declare their botness through the user agent. These could be search engine bots indexing the web, social media bots, etc. Despite not having malicious intent, they cannot convert and are not the target audience, so they should be ignored.
Spoofing Bots whose user agent does not match the actual browser version and/or operating system.
Automated Bots using headless browsers or automation tools like Selenium. The original purpose of such solutions is to automate software, website, application testing, etc. Then bot operators realized they could also use them for click fraud, view fraud, etc., and added them to their inventory.
iFrame During the analysis, we found that the page is located on the site in a small or inconspicuous element. That is, the impression will be counted, but the real user will not see, for example, the ad and will never be able to click on it.

Suspicious visits (SV)

We see something suspicious in the analysis results, but it is not enough to confidently state that it is a bot. Possible reasons include the user having a harmless extension that somehow affects our checks, or the user accessing through a VPN.

Suspicious clicks require an individual approach, for example, to determine where to attribute suspicious traffic based on conversions - to fraudulent or good traffic.

Name Description
SV total Number of suspicious clicks.
Proxy Users accessing through VPN, proxy, or Tor. These are live clicks, but they come from non-targeted geo. If you are buying traffic from a specific geo, and there are a lot of proxies on it, then the traffic is bad.
Suspicion of spoofing We suspect that user agent spoofing techniques are being used in the browser. If this metric is low, there is nothing to worry about. But if its percentage is high and you are not buying any specific mobile traffic, then there is a reason to think about it.
Suspicion of automated We suspect that automation tools are being used in the browser.
Suspicion of fraud Other types of suspicious activity, such as a too-wide screen, can be the result of poor layout or an attempt to hide ads outside the screen.

Feature

Some browser features that we detect.

Name Description
AdBlock Whether AdBlock is installed in the user's browser or not. Note that we only check for the presence of AdBlock; whether it is turned on or off is not checked.
Is mobile Checking by characteristic features (not by user agent) whether the device is mobile (smartphones, tablets) or not (desktops, TVs).
WebView Number of visits with Chrome WebView. Chrome WebView is a greatly reduced functionality version of mobile Chrome that is used in apps to view web pages, as well as many mobile browsers for Android, which are customized WebView. Most WebViews cannot display pushes. Therefore, if there is a high percentage of WebView on push traffic, the traffic may be bad.
IFrame Number of visits made via iframe. <iframe> tag HTML element represents a nested browsing context, embedding another HTML page into the current one.
Push notifications Number of visits from browsers that support push notifications.

Groups

Groups are parameters that allow you to answer the question "which?". From which countries were the clicks? Which browsers did users use?

Time

Name Description
Hour Groups statistics by hours.
Day Groups statistics by days.
Week Groups statistics by weeks.
Month Groups statistics by months. The maximum period that can be selected is two months.

Tags

Name Description
Integration Kaminari integration ID.
Bot type Grouping by bot types.
Referer URL of the page from which the user landed on the page.
Sub1..Sub7 Tags set by the client.

Geo

Name Description
Language User's preferred language, i.e. UI language set in the browser settings.
Timezone Browser time zone, actually the user's operating system time zone.
Country Country data obtained from IP address.
City City data obtained from IP address.
Provider Internet service provider data obtained from IP address.

Device

Name Description
Browser Browser name and version taken from user agent.
Browser engine All modern browsers are based on three open-source engines:
  1. Blink (Chrome, Chromium, Yandex Browser, Samsung Browser, modern Opera and MS Edge, most Android browsers);
  2. WebKit ((Safari; versions of Chrome, Yandex Browser, Firefox, etc. for iOS; browsers in PlayStation);
  3. Gecko (Firefox).

There are also three old unsupported engines that are still present on the internet in the form of Internet Explorer, in MS Edge up to version 18 and in Opera up to version 12. We can determine all 6 engines by their characteristic features, as well as determine the specific version of the engine. It is the browser engine that we write this data to.

OS Operating system and its version taken from user agent.
Real OS The current OS without version.
Device Mobile device manufacturer obtained from user agent.
Device type Device type (desktop, smartphone, smart TV, etc.) obtained from user agent.
Connection type The type of connection that the device uses to connect to the network (Bluetooth, Wi-Fi, mobile internet).

Экран

Название Название Описание
Screen width Ширина экрана Ширина экрана в пикселях.
Screen height Высота экрана Высота экрана в пикселях.
Screen orientation Ориентация экрана Ориентация экрана актуальна для мобильных устройств — портретная, вверх ногами, повёрнуто влево, повёрнуто вправо.
Pixel density Плотность пикселей Сколько экранных пикселей будет использовано для отрисовки одного CSS-пикселя, то есть фактически это разрешение экрана.