Когато ме питат „Какво е това Power BI за Excel?“ винаги се сещам за производството на … лютеница. Каква е връзката? Продължавайте да четете и ще разберете.
Ето накратко как се произвежда лютеница:
Процесът започва с набавянето на суровини – чушки, домати, патладжани, моркови и т.н. Всеки зеленчук се обработва по специфичен за него начин. Чушките и патладжаните ги печем и белим, морковите ги белим и варим, доматите просто ги нарязваме на парчета. След това ги смиламе и получаваме една хомогенна смес.
На следващия етап подлагаме тази смес на термична обработка и добавяме допълнителни съставки като олио, сол, захар, подправки. Финалният етап е пълнене в буркани и стерилизиране и така получаваме готовият продукт. Той вече може да бъде използван по много различни начини – за приготвяне на сандвичи, като гарнитура или за салати.
Мислите, че се шегувам? Уверявам ви – аз съм напълно сериозен. Ето сега ще ви покажа абсолютно същата схема, но този път тя изобразява процеса, по който обикновено се „произвеждат“ отчетите в един финансов отдел например.
Процесът започва с набавянето на изходните данни. Най-често това са някакви xls файлове. Но могат да бъдат и текстови (txt, csv), бази данни в аксес или дори данни от интернет. Почти задължително тези данни не са във вида, който ни върши работа. Затова следващата стъпка е първичната им обработка. Тя се състои в изчистване на данните от излишни редове, колони, превръщане на числа, които са форматирани като текст в истински числа, разделяне на колони или обединяването им, филтриране, сортиране и т.н.
След като сме привели изходните файлове във вид, удобен за логаритмуване, започваме да ги обединяваме. От файла за поръчки взимаме количества и цени, от файла за клиентите – данни като име, пол, възраст. Имаме и трети файл – с данни за търговските представители. От него си взимаме примерно процента на бонуса за постигнати резултати. В четвърти файл пък са данните по бюджет, в пети – резултатите от миналата година. И така натам, и така нататък.
В крайна сметка съставяме една голяма таблица, която съдържа всичката ни необходима информация. Това е нашата основна (или мастър) таблица, нашият готов продукт. Него вече можем да използваме по много различни начини.
Можем да изготвим отчет или да направим анализ на изпълнението спрямо бюджета. Може да бъде основа за допълнителни изчисления (например годишен бонус на търговците). А може и да направим някакъв прост Business Intelligence – например да потърсим връзка между валежите и размера на продажбите.
И като дойде следващият месец – нещата започват от начало. Едни и същи скучни и лишени от добавена стойност стъпки. Копи/Пейст, Find/Replace, VLOOKUP, VLOOKUP, VLOOKUP … Месец след месец. Познато ли ви е?
И знаете ли какво? Тъжната истина е, че много хора са наети като счетоводители, анализатори, маркетинг мениджъри или търговски супервайзори. От тях се очаква да анализират информация, да установяват проблеми и да формулират решения за тях, да търсят нови възможности за печалба. Но в 80% от времето си те правят … лютеница.
И това не е само в България. По неофициални данни три четвърти от близо 700-те милиона потребители на Ексел по света, го използват предимно за производство на лютеница. А още по-неприятното е, че с развитието на модерните технологии обемът на данните става все по-голям и по-голям.
Ето защо с версията 2010 Майкрософт въвеждат Power BI за Ексел. Това са три отделни инструмента:
- Power Query – за първичната обработка на данните и привеждането им в хомогенен вид. В Ексел 2016 този инструмент вече се нарича Get&Transform
- Power Pivot – за анализ на данните
- Power View – инструмент за визуализиране на данните чрез графики и създаване на отчети и дашбордове
Ето как изглежда схемата за работа с данни с Power BI за Ексел:
Както виждате доста по-подреден и олекотен процес. Обърнете внимание, че тук имаме повече възможности за работа с изходни данни. С PowerQuery бързо и лесно можем да обработим наведнъж много еднотипни файлове, намиращи се в една папка. Или пък много шийтове от един ексел файл. Много по-гъвкаво е и изтеглянето на данни от интернет. Възможно е (но не съм го пробвал) дори да теглим данни от фейсбук.
Самата работа в PowerQuery е много лесна и интуитивна. По същество правим същото, каквото си правим в Ексел – разделяме колони, обединяваме колони, Find/Replace, филтрираме, сортираме, изчистваме излишни символи, превръщаме текст в числа и т.н. Само че това става много по-лесно и с повече възможности за избор.
След като сме обработили данните си в PowerQuery, можем да ги заредим в т.нар. Data Model. Най-просто казано това е едно виртуално място, в което създаваме връзки между различните таблици, които ползваме. След това с PowerPivot можем да си направим една пивот таблица, която черпи данни от всички тези таблици с данни. По-просто казано – вече няма нужда да правим VLOOKUP, за да обединим данните от таблицата с продажбите и тази с данните на клиентите. Просто ги вкарваме и двете в Data Model-а и създаваме връзката между тях. Но възможностите на PowerPivot далеч надхвърлят простото елиминиране на VLOOKUP. Това между другото може да се направи и в PowerQuery. Истинската сила на PowerPivot е езикът DAX. С негова помощ могат да се правят задълбочени анализи на данните.
Знам,сега това звучи твърде неясно и абстрактно, но в следващите статии ще разгледам доста практически примери и нещата ще се прояснят.
А, за малко да забравя – с PowerQuery и PowerPivot можете да обработвате милиони редове с данни без дори да ги наливате в шийт на Ексел. Данните стоят в Data Model-а, а всички отчети и анализи се правят посредством пивот таблица.
И най-хубавата част – работата по създаването на нашите заявки в PowerQuery и Data Model е само веднъж. В началото. Следващия месец, просто си пействаме изходните данни в определената папка и натискаме бутона Refresh на нашата пивот таблица. От там нататък всичко се случва автоматично – Ексел работи за нас, а не ние за него.
Няма да ви лъжа – все още Refresh в PowerQuery отнема много време, ако данните са големи по обем. Но можем да го използваме пълноценно: да поразчистим пощата, да прочетем на спокойствие някой важен доклад, да проведем телефонен разговор или просто да обсъдим с колегите снощния мач. По-добре от бъркането на лютеницата, нали? А и Майкрософт работят по оптимизирането на този процес.
Що се отнася до третият елемент – Power View, аз лично не съм очарован от него. И макар Майкрософт да го развиват бързо, за сега ще го оставя настрана.
Следващи стъпки, които ви препоръчвам:
- Преминете към версия на Ексел поне 2013. Версиите на PowerQuery и PowerPivot за Ексел 2010 са доста базови
- Разгледайте указанията и видео уроците на сайта на Майкрософт за Power BI:
- линк за PowerQuery
- линк за PowerPivot
- линк за PowerView (на английски)
- Потърсете структурирано обучение по Power BI за Ексел. Това ще ви спести много време. Горещо препоръчвам ITraining
- Следете блога ми. Интересните статии тепърва предстоят
P.S. През 2013 г. Майкрософт пускат на пазара своя продукт за Business Inteligence, който носи същото име – Power BI. Той се основава на Power Query, Power Pivot и Power View, но има много повече възможности и функции.