Основы анализа данных в Р7-Офисе
ЧТО МЫ БУДЕМ ДЕЛАТЬ
Здесь вы узнаете, как начать работу с данными в Р7-Офисе: импортировать их, сортировать и быстро получать базовую статистику. Это основа для всех последующих задач аналитики.

ИМПОРТ ДАННЫХ ИЗ CSV ВРУЧНУЮ

ИСПОЛЬЗОВАНИЕ ФИЛЬТРОВ И СОРТИРОВКИ

БЫСТРАЯ ОПИСАТЕЛЬНАЯ СТАТИСТИКА

Пример: Подсчет дохода и среднего чека

Допустим, у вас есть таблица продаж:
  • Колонка A: "Дата";
  • Колонка B: "Продажи" (в рублях).
  1. Выделите колонку B и посмотрите сумму в строке состояния — это общий доход.
  2. Среднее значение — это средний чек.
  3. В ячейке C1 введите =SUM(B:B) для итоговой суммы, а в D1 — =AVERAGE(B:B) для среднего.
Инструменты
  • Фильтры и сортировка из меню Данные.
  • Функции: SUM, AVERAGE, COUNT.
Цель
Вы освоили базовые операции: импорт, сортировку и быстрый подсчет. Это фундамент для работы с данными в следующих главах. Попробуйте открыть свой файл и повторить шаги!

Очистка данных вручную

ЧТО МЫ БУДЕМ ДЕЛАТЬ
Очистка данных — первый шаг к их анализу. В этой главе вы научитесь удалять дубликаты, разделять текст и заполнять пропуски, используя только базовые функции Р7-Офиса.

УДАЛЕНИЕ ДУБЛИКАТОВ С ПОМОЩЬЮ ФИЛЬТРОВ И COUNTIFS

РАЗДЕЛЕНИЕ ТЕКСТОВ НА СТОЛБЦЫ

ПОИСК И ЗАМЕНА ПРОПУЩЕННЫХ ЗНАЧЕНИЙ

Пример: Очистка списка e-mail

У вас есть список email: "ivan@example.com", "anna@example.com", "ivan@example.com", некоторые ячейки пусты.
  1. Используйте COUNTIFS, чтобы найти повторения (ivan@example.com встретится 2 раза).
  2. Отфильтруйте и удалите дубликат.
  3. Пустые ячейки заполните "Нет данных" с помощью IF и ISBLANK.
Инструменты
  • Фильтры из меню Данные.
  • Функции: COUNTIFS, IF, ISBLANK.
Цель
Вы научились приводить данные в порядок без сложных инструментов. Теперь они готовы к анализу!

Простая классификация с вероятностями

ЧТО МЫ БУДЕМ ДЕЛАТЬ
Классификация помогает разделять данные на категории. Мы подсчитаем частоты и вероятности вручную, чтобы классифицировать записи.

ПОДСЧЁТ ЧАСТОТ С COUNTIFS И СВОДНЫМИ ТАБЛИЦАМИ

ВЫЧИСЛЕНИЕ УСЛОВНЫХ ВЕРОЯТНОСТЕЙ

  • Добавьте
    колонку C: "Положительный" (1 — если оценка ≥ 4, 0 — если < 4).
  • Формула:
    =IF(B1>=4, 1, 0).
  • Используйте
    SUMPRODUCT: =SUMPRODUCT(C1:C100)/COUNT(C1:C100) — доля положительных отзывов.

КЛАССИФИКАЦИЯ ВРУЧНУЮ С IF

Пример: Классификация отзывов

У вас есть 10 отзывов с оценками 1–5.
  1. Сводная таблица показывает: 3 оценки = 5, 2 = 4, 5 < 4.
  2. Вероятность положительного отзыва: (3+2)/10 = 50%.
  3. Формула IF классифицирует каждый отзыв.
Инструменты
  • Сводные таблицы.
  • Функции: COUNTIFS, SUMPRODUCT, IF.
Цель
Вы освоили простую классификацию, которая пригодится для анализа мнений или поведения.

Сегментация данных с кластеризацией

ЧТО МЫ БУДЕМ ДЕЛАТЬ
Сегментация делит данные на группы. Мы сделаем это вручную, используя средние значения и расстояния.

ГРУППИРОВКА ДАННЫХ ЧЕРЕЗ СВОДНЫЕ ТАБЛИЦЫ

РУЧНАЯ КЛАСТЕРИЗАЦИЯ

Пример: Сегментация покупок вина

У вас 5 клиентов:
  • Клиент 1: 10 покупок, 5000 руб.
  • Клиент 2: 2 покупки, 1000 руб.
  1. Среднее: 6 покупок, 3000 руб.
  2. Расстояния: Клиент 1 — больше среднего, Клиент 2 — меньше.
  3. Разделите на 2 группы вручную.
Инструменты
  • Сводные таблицы.
  • Функции: AVERAGE, SUMPRODUCT.
Цель
Вы научились сегментировать данные без сложных алгоритмов. Это полезно для анализа клиентов или продуктов.

Анализ связей через матрицы

ЧТО МЫ БУДЕМ ДЕЛАТЬ
В этой главе вы научитесь анализировать связи между объектами, создавая простую матрицу с помощью базовых функций
и визуализируя её через графики.

ПОСТРОЕНИЕ МАТРИЦЫ СМЕЖНОСТИ С COUNTIFS

ПОДСЧЕТ СВЯЗЕЙ МЕЖДУ ОБЪЕКТАМИ

  • Внизу матрицы
    добавьте: =SUM(D2:D10) — общее количество покупок каждого товара.
  • Отсортируйте
    по убыванию, чтобы выделить популярные товары.

ВИЗУАЛИЗАЦИЯ ЧЕРЕЗ БАЗОВЫЕ ГРАФИКИ

Пример: Анализ покупок вина

У вас таблица: Клиент 1 купил "Вино А" и "Вино Б", Клиент 2 — "Вино А".
  1. Матрица: Клиент 1 — 1 для А, 1 для Б; Клиент 2 — 1 для А.
  2. Сумма: "Вино А" куплено 2 раза, "Вино Б" — 1 раз.
  3. График показывает популярность товаров.
Инструменты
  • Функции: COUNTIFS, SUM.
  • Базовые графики из меню Вставка.
Цель
Вы научились выявлять связи без сложных инструментов. Это полезно для анализа предпочтений или зависимостей.

Линейная регрессия вручную

ЧТО МЫ БУДЕМ ДЕЛАТЬ
Мы построим простую линейную регрессию, чтобы предсказывать значения, используя базовые функции Р7-Офиса.

ПОСТРОЕНИЕ ФИКТИВНЫХ ПЕРЕМЕННЫХ

  • Возьмите таблицу:
    колонка A — "Реклама" (тыс. руб.), B — "Продажи" (тыс. руб.).
  • Если есть категории
    (например, "Тип рекламы"), добавьте колонку C с IF: =IF(A1>50, 1, 0) — фиктивная переменная.

ВЫЧИСЛЕНИЕ НАКЛОНА И ПЕРЕСЕЧЕНИЯ

ПРОГНОЗЫ С БАЗОВЫМИ ФОРМУЛАМИ

Пример: Прогноз продаж

Реклама: 10, 20, 30; Продажи: 50, 60, 70.
  1. SLOPE ≈ 1, INTERCEPT ≈ 40.
  2. Прогноз для 25 тыс. руб.: 1*25 + 40 = 65 тыс. руб.
Инструменты
  • Функции: IF, SLOPE, INTERCEPT, SUMPRODUCT.
Цель
Вы освоили базовую регрессию для простых прогнозов, например, влияния рекламы на продажи.

Ансамбли простых решений

ЧТО МЫ БУДЕМ ДЕЛАТЬ
Мы создадим простую модель ансамбля (bagging) для классификации, используя случайность и подсчет голосов.

СОЗДАНИЕ СЛУЧАЙНЫХ ВЫБОРОК С RAND

  • Таблица:
    колонка A — "Клиент", B — "Покупка" (1 — да, 0 — нет).
  • В колонке C:
    =RAND() — случайное число для каждой строки.
  • Отсортируйте по C
    и возьмите первые 5 строк как выборку.

ПОДСЧЕТ ГОЛОСОВ ЧЕРЕЗ COUNTIFS И SUM

ПРОСТОЙ BAGGING ВРУЧНУЮ

Пример: Классификация покупок

5 клиентов: 3 купили, 2 нет.
  1. Выборка 1: 2 "Да", 1 "Нет".
  2. Выборка 2: 1 "Да", 2 "Нет".
  3. Итог: "Да" побеждает (2 голоса против 1).
Инструменты
  • Функции: RAND, COUNTIFS, SUM, IF.
Цель
Вы научились улучшать классификацию с помощью простого ансамбля.

Простое прогнозирование спроса

ЧТО МЫ БУДЕМ ДЕЛАТЬ
Мы спрогнозируем спрос с помощью экспоненциального сглаживания и случайных сценариев.

ЭКСПОНЕНЦИАЛЬНОЕ СГЛАЖИВАНИЕ (SES)

РУЧНОЙ РАСЧЕТ СКОЛЬЗЯЩЕГО СРЕДНЕГО

  • В D2:
    =AVERAGE(B1:B3) — среднее за 3 месяца.
  • Скопируйте
    вниз.

СЛУЧАЙНЫЕ СЦЕНАРИИ С RAND

Пример: Прогноз спроса на мечи

Спрос: 100, 110, 105.
  1. SES: C2 = 100, C3 = 103, C4 ≈ 104.
  2. Скользящее среднее: 105.
  3. Сценарий: 104 ± 10.
Инструменты
  • Функции: IF, SUM, AVERAGE, RAND, NORM.INV.
Цель
Вы освоили базовое прогнозирование для планирования спроса.

Оптимизация вручную

ЧТО МЫ БУДЕМ ДЕЛАТЬ
В этой главе вы научитесь оптимизировать решения вручную, используя подсчеты и простые условия, чтобы найти лучший вариант без сложных инструментов.

ПОДСЧЕТ ЗАТРАТ И ОГРАНИЧЕНИЙ С SUMPRODUCT

РУЧНАЯ НАСТРОЙКА ПАРАМЕТРОВ

  • Изменяйте значения
    в колонке B вручную (например, 5, 10, 15).
  • Проверяйте
    D1 и E1, чтобы стоимость не превышала 1000.
  • Отфильтруйте
    строки с "ОК" для допустимых вариантов.

ПРОСТЫЕ БИНАРНЫЕ ИНДИКАТОРЫ

Пример: Оптимизация смеси сока

Продукты: Апельсин (50 руб.), Лимон (30 руб.), бюджет 1000 руб.
  1. Количество: 15 и 20, стоимость = 1550 + 2030 = 1350 (превышение).
  2. Попробуйте 10 и 15: 1050 + 1530 = 950 (ОК).
  3. Индикаторы: 2 продукта выбрано.
Инструменты
  • Функции: SUMPRODUCT, IF, SUM.
  • Фильтры из меню Данные.
Цель
Вы научились находить оптимальные решения вручную, что полезно для планирования ресурсов.

Поиск аномалий

ЧТО МЫ БУДЕМ ДЕЛАТЬ
Мы найдем необычные значения в данных, используя квартили и нормальное распределение, чтобы выявить аномалии.

ВЫЧИСЛЕНИЕ КВАРТИЛЕЙ С QUARTILE

  • Таблица:
    колонка A — "Время ответа" (мин).
  • В B1:
    =QUARTILE(A:A, 1) — Q1, в C1: =QUARTILE(A:A, 3) — Q3.
  • Межквартильный
    размах (IQR): в D1 — =C1-B1.

ПРОВЕРКА НОРМАЛЬНОСТИ С NORM.DIST

ОПРЕДЕЛЕНИЕ ВЫБРОСОВ ЧЕРЕЗ TUKEY’S FENCES

Пример: Аномалии в техподдержке

Время ответа: 5, 6, 7, 20.
  1. Q1 = 5.5, Q3 = 13.5, IQR = 8.
  2. Границы: -6.5 и 25.5.
  3. 20 — выброс.
Инструменты
  • Функции: QUARTILE, NORM.DIST, AVERAGE, STDEV.S, IF, OR.
Цель
Вы научились находить аномалии, что важно для контроля качества данных.

Расширение возможностей Р7-Офиса

ЧТО МЫ БУДЕМ ДЕЛАТЬ
Мы узнаем, как выйти за рамки Р7-Офиса, экспортируя данные и используя базовые графики для подготовки к более сложным инструментам.

ЭКСПОРТ ДАННЫХ В CSV

ИСПОЛЬЗОВАНИЕ БАЗОВЫХ ГРАФИКОВ

Рекомендации по другим инструментам
  • Google Sheets: бесплатные функции вроде QUERY.
  • LibreOffice Calc: поддержка макросов для автоматизации.
Пример: Подготовка данных

Экспортируйте таблицу продаж в CSV и постройте график в Р7-Офисе для предварительного анализа.
Инструменты
  • Экспорт CSV.
  • Базовые графики.
Цель
Вы подготовили данные для перехода к другим инструментам, сохраняя простоту работы.