Графиките от вида word cloud или буквално преведено облак от думи придобиха широка популярност в последно време. Те са създадени за бърз анализ и визуализация на честотата на използване на думи в даден текст. Колкото по-често се среща една дума в текста, толкова по-едър шрифт се използва за нея. Така най-често използваните думи се открояват добре и се забелязват лесно. Този метод на анализ си има своите ограничения, които не са предмет на статията. Визуализацията обаче изглежда добре и може с успех да се използва в отчети, дашбордове, презентации.
Съществуват редица инструменти, с които бързо и лесно могат да се съставят такива графики. Аз много харесвам например wordle.net. Но разбира се word cloud може да бъде направен и в Ексел. В тази статия ще илюстрирам един от възможните методи, „изобретен“ от Mr. Excel – Bill Jelen. Неговите пълни указания можете да видите в това видео: https://www.youtube.com/watch?v=fgfwSEBXQCM
А ето и моите обяснения с картинки:
Най-напред, необходимо е текстът, за който ще правим word cloud, да се превърне в списък с думи, подреден в низходящ ред според честотата на срещане на думите. Как става това е обяснено в част 4 от поредицата. В нашия случай това е списъкът с думи от текстовете на големия български певец Васил Найденов.
Следващата стъпка е да очертаем площта, на която искаме да изградим графиката. Най-добре на отделен шийт. В случая просто съм сложил светлосив фон на група от клетки, така че да се образува правоъгълник.
Сега се връщаме при списъка с думите и въвеждаме следната проста формула:
Копираме я надолу, колкото пъти желаем. В случая искам таблицата да включва 30 думи, затова копирам до 30 номер. Нищо не пречи да увеличим или намалим броя на думите.
Форматираме различните думи по различен начин. Както виждате за най-често срещаната дума („любов“) е с на-едър шрифт (в случая Ариел, 56). Следващите три думи са с по-дребен, следващите с още по-дребен и т.н.
Изборът на шрифт, размер, цвят, както и кои точно думи как да се форматират е изцяло въпрос на вкус.
Сега идва интересното. Разширяваме колоната с форматираните думи (в сл. Колона F). Убеден съм, че знаете най-бързия начин за това – двоен клик на границата на колони F и G. После избираме клетката с най-често срещаната дума и ctrl+C (copy).
Отиваме на сивия правоъгълник и File > Paste > Paste Special
И избираме Linked picture
Получава се това:
Правим същото със следващите по честота думи като ги подреждаме както ни харесва
И със следващите по ред:
Всяка една дума всъщност е картинка и с влачене можем да ги пренареждаме докато получим конфигурация, която ни харесва. Да кажем, че това е желаната от нас графика:
Бихме могли да спрем до тук, но ако трябва картинката да я вмъкваме в други документи, например презентации, по-добре да приложим още един път номера с Paste Special >Linked picture.
За целта маркираме целия сив правоъгълник, натискаме CTRL+C, отиваме на място, където си харесаме и пействаме картинката. В случая аз съм я пейстнал до оригиналната.
И сега, когато нашата графика вече е картинка, можем да си я обработим като такава с инструментите от менюто Picture Tools. То се появява, когато кликнем върху картинката и предоставя доста интересни възможности за обработка.
Например, от Crop > Crop To Shape можем да придадем определена форма на нашата картинка.
В случая – елипса
Но може да бъде облак
Звезда
С малко допълнителна играчка можем да го докараме и до Междузвездни войни.
Това накратко е методологията за изработване на word cloud в Ексел. Може да се използва за представяне на най-продаваните продукти, най-често срещаните думи в коментари за даден хотел, посещавани туристически дестинации и др.
Ето например кои са 20-те футболни клуба с най-големи приходи за 2017г. според Deloitte Football Money League
Статията е част от поредица за сваляне и анализ на данни от интернет, чрез Power Query. Ето и връзките към предишните статии: