Markov B.M.
Candidate of Economic Sciences
Doctorate of Alfred Nobel University in Dnipro, Ukraine
Марков Б.М.
к.е.н., докторант
Університету імені Альфреда Нобеля
THEORETICAL APPROACHES TO DETERMINATION OF THEESSENCE AND METHODS OF SEGMENTATION AND CLUSTERING
OF RETAIL TRADE ENTERPRISES
ТЕОРЕТИЧНІ ПІДХОДИ ДО ВИЗНАЧЕННЯ СУТНОСТІ ТА МЕТОДІВ СЕГМЕНТУВАННЯ ТА КЛАСТЕРИЗАЦІЇ
РОЗДРІБНИХ ПІДПРИЄМСТВ
Summary. After analyzing the main theoretical and methodological approaches to determining the essence and methods of segmentation, we can generalize that segmentation can be defined as the selection of certain groups of homogeneous objects based on their generality and a unified approach to their study. Among the methods of segmentation, the most common is the a priori method which is used when a researcher knows exactly the segmentation characteristics, as well as the number of segments, their main parameters, and the like.
Having compared the basic theoretical approaches to the essence and methods of clustering, we can generalize that the essence of clustering consists in the multi-stage combination of classification elements in homogeneous groups (clusters), based on the principles of greatest similarity in groups and the greatest difference between groups, the main advantage of clustering is that it enables to construct multidimensional hierarchical classifications of objects the by cumulative evidence. Methods of clustering are divided into hierarchical and non-hierarchical ones. More common is the first type, in particular hierarchical agglomeration method based on the immediate neighborhood. In most cases, a metric such as the Euclidean distance is used.
Keywords: segmentation; clustering; retail enterprise; agglomeration method; criterion.
Анотація. Проаналізувавши у статті основні теоретико-методологічні підходи до визначення сутності та методів сегментування, можемо узагальнити, що сегментування можна визначити як виокремлення певних груп однорідних об’єктів на основі їх спільності та єдиного підходу до їх дослідження. Серед методів сегментування найбільш поширеним є апріорний.
Порівнявши основні теоретичні підходи до сутності та методів кластеризації, можемо узагальнити, що сутність кластеризації полягає у багатоетапному об’єднанні елементів класифікації в однорідні групи (кластери), ґрунтуючись на принципах найбільшої подібності в групах та найбільшої різниці між групами. Основною перевагою кластеризації є те, що вона дає змогу будувати багатовимірні ієрархічні класифікації об’єктів за сукупністю ознак.
Ключові слова: сегментування; кластеризація; роздрібне підприємство; агломеративний метод; критерій.
Постановка проблеми.Сегментування та кластеризація історично існували у маркетингу і використовуються активно в цій сфері й зараз, однак, з огляду на його ефективність, вони перетворились із суто маркетингового засобу в один з важливих інструментів, що входить до арсеналу економічного аналізу. Саме тому багато дослідників на сьогодні займаються визначенням сутності та аналізом основних методів сегментування та кластеризаці.
Аналіз існуючих досліджень і публікацій. Дослідженням сутності, визначенням методів та здійсненням сегментування та кластеризації підприємств займаються такі вчені, як Л. Куцеконь, Л. Забуранна, Р. Якимець, К. Гавриш, С. Бєлай,П. Коваль, Л. Васильєва,В. Саричев, О. Ткаченко, М. Білик та інші.Їхні праці містять багатий теоретичний та практичний матеріал, однак необхідність адаптації існуючих підходів та методів кластеризації до підприємств роздрібної торгівлі вимагає проведення подальших досліджень.
Мета дослідження: дослідити основні теоретико-методологічні підходи до здійснення сегментування та кластерного аналізу суб’єктів господарювання на ринку роздрібної торгівлі.
Виклад основного матеріалу дослідження. Взагалі, сегментація передбачає поділ певної сукупності об’єктів на сегменти, тобто певні групи, в рамках яких об’єкти демонструють подібну реакцію на однакові стимули. Сегментування історично використовувалось у маркетингу і використовується активно в цій сфері й зараз, однак, з огляду на його ефективність, воно перетворилось із суто маркетингового засобу в один з важливих інструментів, що входить до арсеналу економічного аналізу. Саме тому багато дослідників на сьогодні займаються визначенням сутності та аналізом основних методів сегментування.
Так, згідно з підходом О. Лотиш, сегментація є універсальним способом розподілу певної галузі на окремі однорідні групи [1, с.120]. Як наголошує науковець, даний процес варто застосовувати не лише стосовно покупців для виокремлення певного цільового сегмента, але й стосовно виробників, асортименту товарів і т.д. Відповідно, актуальним є застосування сегментування і для роздрібних торговельних підприємств, з огляду на їх поширення та різноманіття. У цілому, сегментування допомагає ретельніше аналізувати особливості діяльності всіх функціонуючих на ринку підприємств, будувати карти конкурентних груп та визначати межі можливих сегментів. Власне, сама сутність процесу сегментування в тому, щоб усіх споживачів ринку чи всі підприємства на ринку об’єднувати в окремі однорідні групи за певними ознаками, а потім обирати потрібні та розробляти стратегії впливу на них.
Згідно з Дж. В. Томасом, на базовому рівні термін «сегментація» відноситься до поділу сукупності за певною спільністю, подібністю або спорідненістю [2, с.1]. Тобто члени сегменту поділяють щось спільне. Метою сегментації є концентрація енергії та сил на підрозділі (або сегменті) для отримання конкурентної переваги або підвищення ефективності діяльності в рамках цього сегмента. Концентрація енергії (або сили) є часто основою стратегії, а сегментація ринку — це концептуальний інструмент, який допоможе досягти такої концентрації. Дж. В. Томас займається дослідженням процесу сегментації і виокремлює такі основні помилки, яких допускаються дослідники при здійсненні сегментування і які необхідно враховувати в даній роботі при сегментуванні роздрібних торговельних підприємств: сегментування сегментів — багаторівневе сегментування, як розглядатиметься далі, може бути ефективним, однак побудова «піраміди сегментів» може привести до виокремлення занадто малих груп, користь від аналізу яких не зможе покрити витрати на їх виокремлення; підбір «загальних» сегментаційних ознак — якщо сегментаційні ознаки не можуть розподіляти групу на окремі підгрупи, оскільки однаково характеризують усіх учасників сукупності, вони не можуть вважатись сегментаційними ознаками і їх застосування при сегментуванні є недоцільним; створення занадто великої кількості сегментів — вважається, що найбільш оптимальною кількістю сегментів є 5-6, а значне перевищення цієї норми веде до складнощів при виборі сегмента для дослідження і підвищенні ризику помилки; фокусування одразу на всіх сегментах — сама мета сегментування полягає в подальшому виборі одного цільового сегмента, а тому фокусування одразу на всіх сегментах веде до нераціонального використання ресурсів дослідника.
Розглядаючи питання сегментування, І. Ковшова наголошує, що найбільш ефективним є саме багаторівневе сегментування [3, с.105]. При цьому дослідниця виокремлює макросегментування та мікросегментування. Для макросегментування основними сегментаційними ознаками є функції, групи клієнтів та технології. Так, оскільки всі торговельні підприємства виконують подібну функцію та застосовують подібні технології, за цими сегментаційними ознаками ми, власне, й ідентифікуємо торговельні підприємства. До групи торговельних підприємств належать дві великі категорії — оптові торговельні підприємства та роздрібні торговельні підприємства. Оптові торговельні підприємства слугують посередниками між виробниками та роздрібними торговцями, накопичуючи в себе значні запаси продукції і реалізуючи її роздрібним торговцям з невеликими націнками, «заробляючи» на товарообороті, адже продукція реалізується, як правило, великими партіями. Роздрібні ж торговці слугують здебільшого посередниками між оптовиками та кінцевими споживачами. Саме вони забезпечують надходження кінцевої продукції до споживачів, а тому реалізують вони її в дрібних кількостях, однак широкому колу покупців.
Таким чином, за критерієм «групи клієнтів» дані категорії торговельних підприємств різняться, а тому ми можемо здійснити макросегментацію групи «торговельні підприємства» за цією сегментаційною ознакою і, нарешті, виокремити категорію «роздрібні торговельні підприємства», яка стане предметом мікросегментації. Мікросегментація, згідно з підходом І. Ковшової, полягає в розподілі групи, виокремленої внаслідок макросегментації, на дрібніші підгрупи за більш деталізованими сегментаційними ознаками.
Взагалі, сегментування роздрібних торговельних підприємств належить до категорії так званого В2В-сегментування. Дослідженням В2В-сегментування активно займається британська дослідницька організація CircleResearchLtd. Взагалі, концепція В2В — сегментування є подібною до концепції традиційного, або В2С-сегментування, однак у цьому випадку сегментуються саме підприємства.
Таким чином, при сегментуванні підприємств, у тому числі й підприємств роздрібної торгівлі, необхідно застосовувати особливі підходи та методи. О. Лотиш наголошує, що при проведенні сегментування генеральної сукупності, згідно зі світовою практикою, використовуються два основні методи: метод апріорі (a priori) та метод кореляційної сегментації (posthoc). Метод «апріорі» застосовується у тому разі, коли досліднику точно відомі сегментаційні ознаки, а також кількість сегментів, їх основні характеристики і тому подібне, тобто коли у дослідника наявна вся суттєва інформація стосовно генеральної сукупності та потенційних сегментів у межах цієї генеральної сукупності. Як правило, даний метод застосовують за невеликої кількості сегментів ринку. Другий же метод, тобто метод кореляційної сегментації, застосовується у випадку невизначеності сегментаційних ознак, а також сутності самих сегментів, ідентифікація яких і є метою проведення дослідження [1, с.122-123].
Отже, сегментування можна визначити як виокремлення певних груп однорідних об’єктів на основі їх спільності та єдиного підходу до їх дослідження.
Як зазначає Г. Корепанов, кластерний аналіз, подібно до кореляційно-регресійного аналізу, являє собою математичний апарат для дослідження статистичних зв’язків. По суті, він є методом пошуку певних емпіричних закономірностей, однак для ширшого класу зв’язків [4, с.64]. Важливим є той факт, що кластерний аналіз не вимагає однорідності між класами об’єктів. У цілому, суть здійснення кластерного аналізу в тому, що класифікація базується не на одній ознаці, а одразу на декількох. Внаслідок цього утворюються так звані кластери, тобто певні сукупності об’єктів, котрим властиві певні загальні ознаки. З цією метою необхідно ввести певні показники, які характеризували б певною мірою близькість за усіма параметрами.
Взагалі, основна ціль проведення кластерного аналізу — знайти наявні структури, тобто утворити групи подібних елементів. Разом з тим його функція — і внести структуру в об’єкти дослідження. Тобто, кластерний аналіз застосовується тоді, коли необхідно виявити структуру, але візуально спостерігати її неможливо.
Існує багато підходів до методів кластеризації. Розглянемо найбільш поширені з них. Л. Куцеконь вважає, що найбільш зручними для використання є ієрархічні агломеративні процедури [5, с.100].Ієрархічну агломеративну процедуру з використанням евклідової метрики, яку використовує Л. Куцеконь, можна охарактеризувати наступним чином. На нульовому кроці беремо початкову сукупність n елементарних кластерів і обчислюємо матрицю відстаней між ними. При цьому застосовуємо наступну формулу:
Надалі, з кожним наступним кроком відбувається об’єднування двох кластерів, відповідно, Rs і Rt , що сформувались на попередньому етапі, у єдиний кластер Rs∪Rt. При цьому розмірність матриці відстаней, звичайно, буде зменшуватись, к порівнянні з розмірністю матриці на попередньому етапі на 1. Обчислювати відстані di,st між відповідними кластерами Rst і Ri (i≠s,t) можна, застосовуючи належну формулу відстані між окремими кластерами, а сама процедури завершується, коли всі об’єкти є, так би мовити, позначеними.
Також даний дослідник пропонує свою версію оцінки потенційної ефективності функціонування кластерів. Для розрахунку цієї потенційної ефективності необхідно, згідно з науковцем, визначити ключову відмінність сукупної ефективності кластера від загальної суми рівнів ефективності підприємств, що походить із самої суті кластера і обґрунтованого дослідником синергетичного ефекту.
О. М. Ткаченко пропонує вдосконалений метод k-середніх, спрямований на мінімізацію спотворень і відповідних похибок, так званий, глобальний алгоритм k-середніх [6, с.26-27]. Як зазначає науковець, в основі кластеризації за методом k-середніх лежить процес трансформації множини центроїдів в іншу множину, яка є поліпшеною шляхом зведення до мінімуму ймовірності спотворень через перерозподіл вхідних векторів між відповідними кластерами. Так, за даним методом, процес кластеризації починається з певного «стартового» значення центроїдів, а сам процес трансформації повторюється до тих пір, допоки не буде задоволена необхідна умова закінчення. Якщо позначити відповідну множину центроїдів, одержаних на ітерації t, SCt = {ci}, то сам алгоритм кластеризації k-середніх в стандартній версії може описуватися наступним шляхом: крок 1. Встановити t = 0 і задати стартове розміщення центроїдів SC0. Крок 2. Для наявної множини центроїдівSCt з метою одержання вдосконаленої множини центроїдів SCt+1 знайти таке розбиття S, яке розподілило б S по k кластерах, при цьому Si (i =1,2,…,k)і виконується умова:
Далі необхідно обчислити центроїд cі для кожного кластера Si =(i 1,2,…,k) задля отримання нової множини центроїдів SCt+1:
при цьому mi — це кількість векторів, які належать Si.
Нарешті, крок 3 передбачає розрахунок сукупного спотворення для SCt+1. При цьому використовується наступна формула:
Після розрахунку отриманий результат порівнюються з отриманим на попередній ітерації. Якщо різниця є надто малою, можна завершувати процес, якщо ні, то змінюємо t на t+1 і повертаємось до другого етапу.
К. Гавриш зауважує, що перед застосуванням методів кластеризації необхідно здійснити стандартизацію даних і пропонує декілька методів такої стандартизації, зокрема метод Z-перетворення, що передбачає віднімання середнього значення від значень змінних, і подальший поділ отриманих значень на середньоквадратичне відхилення. Сам процес здійснюється за такою формулою:
К. Гавриш пропонує і інші способи стандартизації даних, зокрема трансформацію змінних до значень в інтервалі (–1; 1),трансформування змінних до значень в інтервалі (0; 1); максимальне значення 1, коли значення усіх змінних діляться на їх максимум; середнє значення 1, коли значення змінних ділять на їх середнє; середньоквадратичне відхилення дорівнює 1, коли значення змінних ділять на середньоквадратичне відхилення [7, с.218].
Після стандартизації можна здійснювати кластерний аналіз, при якому К. Гавриш пропонує використовувати наступні методи: метод одинарного зв’язку, коли об’єднують два об’єкти з максимально можливою мірою схожості, на наступній стадії до цих двох об’єктів приєднується об’єкт з максимально можливим ступенем схожості з одним із двох.
Детально методи та алгоритми кластеризації розглядає Р. Якимець. Так, він наводить їх класифікацію, зокрема поділ на ієрархічні та неієрархічні, а також на чіткі та нечіткі. При цьому, як пояснює автор, ієрархічні методи надають а результаті рішення у вигляді дерева з багатьма точками «розбиття», у той час, як неієрархічні (або пласкі) надають лише одне розбиття [8, с.48]. Чіткі алгоритми надають усім елементам вибірки певний номер кластера, що значить, що кожний елемент має відноситись тільки до одного кластера, у той часяк нечіткі алгоритми надають кожному об’єкту у відповідність набір значень, котрі демонструють міру належності об’єкта до кластерів. Значить, кожний елемент може відноситись до кожного кластеру з певною імовірністю.
Як вказує Р. Якимець, агломеративні методи — це ті методи кластерного аналізу, котрі допомагають кластеризувати «знизу верх». На старті алгоритму кожна з точок має розглядатись як кластер, а потім алгоритм «працює» над об’єднанням найближчих сусідніх точок в один уже більший кластер і так надалі, щоб врешті об’єднати усі кластери в єдиний великий кластер. Агломеративні алгоритми ще називаються AGNES. Хід алгоритму виглядає наступним чином: – спочатку використовують такий з методів одноканального зв’язку, як «найближчий сусід», та матрицю відмінностей; потім відбувається злиття вузлів, котрі мають найменш помітні відмінності; нарешті, усі вузли, вкінці-кінців, можуть об’єднатись в один кластер.
де R — ризик
Як випливає з формули 6, з ростом відношення D / d ймовірність помилки відділення внутрішньокластерних найближчих відстаней від міжкластерних зменшується. Крім того, на хід функції R впливає кількість вимірів простору, тобто кількість параметрів m. Зі збільшенням кількості вимірів простору значення R падає з ростом відношення D / d різкіше.
Цю ймовірність помилки R, згідно з формулою 6, П. Коваль пропонує прийняти за критерій якості кластеризації: чим менша ймовірність помилки R, тим вище якість кластеризації.
Н. Гладинець вважає, що особливо важливою стадією здійснення кластерного аналізу є розрахунок відстані між досліджуваними об’єктами. Відстані між точками x та y дослідниця визначає за формулою евклідової відстані, що є, за її визначенням, геометричною відстанню в багатовимірному просторі [9, с.58]. У результаті проведення кластерного аналізу за рахунок використання визначеної міри схожості Н. Гладинець відображає структуру кластерів елементів, які утворилися за рахунок об’єднання елементів у великі кластери. Для демонстрації результатів застосування агломеративного методу Н. Гладинець використовує графічний метод, який має на меті побудову дендрограми. Внаслідок побудови дендрограми дослідниця отримує ієрархічну структуру галузевих кластерів. На вертикальній осі графіку вона відкладає номери (символи) відповідних елементів, на горизонтальній осі відбувається фіксація міжкластерних евклідових відстаней; при цьому спостерігається поступове ослаблення критерію об’єднання. Для утворення груп подібних об’єктів Н. Гладинець обрала метод Уорда, оскільки він передбачає оптимізацію мінімальної дисперсії в рамках кластерів. Така цільова функція відома під сумою квадратів відхилень або внутрішньогруповою сумою квадратів.
Активним дослідженням і застосуванням кластерного аналізу займається В. Шуканов. Згідно з даним дослідником, кластерний аналіз як загальнонауковий метод дає змогу будувати багатовимірні ієрархічні класифікації об’єктів за сукупністю ознак. Сутність процесу полягає у багатоетапному об’єднанні елементів класифікації в однорідні групи (кластери), ґрунтуючись на принципах найбільшої подібності в групах та найбільшої різниці між групами. Класифікація при кластерному аналізі здійснюється у багатовимірному параметричному просторі. Вчений зазвичай в якості дистанційного коефіцієнта використовує відстань Евкліда, а в якості методу групування – максимізацію міжгрупової дисперсії [10, с.65-66]. В результаті проведення кластерного аналізу дослідник отримує дендрограму, де відображена структура зв’язків між об’єктами і параметрами. Таким чином, через порівняння дендрограм на різних часових проміжках можна робити висновки стосовно динаміки зміни цих зв’язків. Великою перевагою кластерного аналізу є можливість розподіляти елементи за групами не за однією ознакою, а за цілим комплексом характеристик. Окрім цього, кластерний аналіз, на відміну від більшості математично-статистичних методів, не накладає обмеження на об’єкти дослідження і робить можливим розгляд безлічі вихідних даних майже довільної природи. Як вважає В. Шуканов, перевагою саме ієрархічного методу кластеризації є його наочність, забезпечена побудовою дендрограми.
О. Приставка в ході аналізу підтримки прийняття рішень у задачах кластерного аналізу формує оцінку ієрархічних методів кластеризації. Саме цим методам дослідниця приділяє особливу увагу. Так, серед основних ієрархічних методів кластеризації О. Приставка виокремлює метод найближчого сусіда, метод найвіддаленішого сусіда, метод середнього зв’язку, метод центрального зв’язку, метод Уорда [11, с.120]. Дослідниця оцінює їх за функціональними якостями і в результаті її оцінки найбільш ефективним виявився метод найближчого сусіда, адже він найчастіше забезпечує найбільш точний розподіл генеральної сукупності за кластерами.
Висновки. Проаналізувавши основні теоретико-методологічні підходи до визначення сутності та методів сегментування, можемо узагальнити, що сегментування можна визначити як виокремлення певних груп однорідних об’єктів на основі їх спільності та єдиного підходу до їх дослідження.
Порівнявши основні теоретичні підходи до сутності та методів кластеризації, можемо узагальнити, що сутність кластеризації полягає у багатоетапному об’єднанні елементів класифікації в однорідні групи (кластери), ґрунтуючись на принципах найбільшої подібності в групах та найбільшої різниці між групами, основною перевагою кластеризації є те, що вона дає змогу будувати багатовимірні ієрархічні класифікації об’єктів за сукупністю ознак.
Список літератури:
- Лотиш О. Я. Сегментація ринку як елемент стратегічного аналізу галузі /О.Я. Лотиш// Науковий вісник Міжнародного гуманітарного університету. — 2017. — с. 120-124.
- Thomas J. W. Market Segmentation // Decision Analyst: Market Segmentation. — 2017. — Режим доступу: https://www.decisionanalyst.com/media/ downloads/MarketSegmentation.pdf
- Ковшова І. О. Процес багаторівневої сегментації для підприємств на ринку корпоративних продаж послуг зв’язку / І. О. Ковшова // Формування ринкових відносин в Україні. — 2011. — № 2. — С. 104-108. —
- Корепанов Г. С. Застосування кластерного аналізу для групування регіонів за рівнем інвестиційної привабливості / Г. С. Корепанов, Ю.О. Лазебник, Т. В. Пономарьова // Вісник Харківського національного університету імені В. Н. Каразіна. Серія Економічна. — 2014. — № 1118, вип. 88. — С. 63-70.
- Куцеконь Л. О. Теоретико-методичні аспекти кластеризації підприємств / Л. О. Куцеконь // Науковий вісник Херсонського державного університету. Сер. : Економічні науки. — 2014. — Вип. 8(1). — С. 100-103.
- Ткаченко О. М. Метод кластеризації на основі послідовного запуску
k-середніх з обчисленням відстаней до активних центроїдів / О.М. Ткаченко, Н. О. Біліченко, О. Ф. Грійо-Тукало, О. В. Дзісь // Реєстрація, зберігання і обробка даних. — 2012. — Т. 14, № 1. — С. 25-34. - Гавриш К. С. Кластерний аналіз підприємств готельного господарства України / К. С. Гавриш // Бізнес Інформ. — 2013. — № 7. — С. 216-224.
- Якимець Р. В. Методи кластеризації та їх класифікація / Р. В. Якимець // Міжнародний науковий журнал. — 2016. — № 6(2). — С. 48-50.
- Гладинець Н. Застосування кластерного аналізу для оцінки розвитку інноваційної діяльності промисловості України / Н. Гладинець // Схід. — 2013. — № 6. — С. 55-61.
- Шуканов П. В. Соціально-економічна систематизація країн світу методом кластерного аналізу / П. В. Шуканов // Науковий вісник Полтавського університету економіки і торгівлі. Сер. : Економічні науки. — 2012. — № 4. — С. 64-69.
- Приставка О. П. Підтримка прийняття рішень у задачах кластерного аналізу / О. П. Приставка, М. Г. Сидорова // Актуальні проблеми автоматизації та інформаційних технологій. — 2011. — Т. 15. — С. 115-123.