Linkedin (LI) e най-старата социална мрежа, възникнала преди фейсбук и свързваща в момента над 650млн. потребители По данни, на които попаднах наскоро, българските профили в нея са около 800 хиляди. Голяма част от тези потребители са неактивни или фиктивни, но не е малък броят и на тези, които присъстват в мрежата с цел развитие на бизнес или собствен бранд (ех че хубава българска дума е това „бранд“ само). Предполагам за тях ще бъде интересно да разберат какви данни съхранява за тях Linkedin и как могат да си ги набавят.
LI твърди, че е отговорна компания и предоставя тези данни абсолютно безплатно и по всяко време, когато ги поискаме. А списъкът с тези данни никак не е малък, както се вижда от долната картинка:
За последнете два месеца съм си свалил моите данни по начина, по който ще ви покажа, около 10 пъти. И наистина не са ми искали никакви пари, нито са ми направили забележка, че прекалявам. Дали това обаче са всички данни, които съхраняват за всеки един профил – само мога да гадая.
И така – как да си свалим данните, които Linkedin, съхранява за нас:
Кликаме на малката стрелкичка под снимката на личния ни профил (там където пише Me)
Отиваме на How Linkedin uses your data > Get a copy of your data
След това имаме две опции: да свалим пълен архив или само някаква част (например само личните съобщения или само контактите). В случая аз съм избрал пълен архив
От съображения за сигурност Linkedin ни иска да въведем паролата си за вход
И след това ни казва, че заявката ни е приета и до 24 часа ще получим данните. Разбираме кога са налични по съобщението Download available
С бутона download сваляме един zip файл и остава само да го разархивираме:
Папката Articles съдържа всикчи сатии, които съм публикувал в Linkedin, като локални html файлове. Мога да кликна на всеки от тях и ще ми се отвори текстът на съответната статия.
В папката Jobs се съдържа информация за позициите, за които съм кандидатствал през Linkedin, ако има такива.
А ето накратко какво се съдържа в другите файлове:
Файл |
Съдържа |
Ad_Targeting.csv | Данни, които изглежда се използват от LI да ни таргетира за реклами |
Certifications.csv | Получени сертификати от LI |
Company Follows.csv | Кои компании следваме в LI. Покзава компанията и кога сме я последвали |
Connections.csv | Списък с всички контакти в Linkedin. Съдържа първото и последното име, с което е регистриран човекът в мрежата, компанията, в която работи, позицията му и датата, на която сме се свързали |
Contacts.csv | Това беше голяма изненада за мен лично. Linkedin има информация за мои контакти от yahoo, мобилния телефон. Имената, с които съм ги въвел, телефонен номер, евентуално имейл и кога съм ги въвел. Интересното е, че не всички номера са там. Как ги подбира – не зная |
Email Addresses.csv | съдържа имейл адресите, които съм регистирал в LI |
Events.csv | Събитията, които следвам – име, дата на събитието, статус (ATTENDING / NOT_ATTENDING) и линк към него |
Invitations.csv | Всички покани от и към мен да създадем контакт. Име на човека, съобщение (ако има такова), дата и посоката OUTGOING / INCOMING Забелязах, че изпратените от мен покани са най-много 6 месеца назад, докато получени имам и от 2016 г. |
Learning.csv | Обучения, които по някакъв начин съм разглеждал. Име на курса, описание на съдържанието, кога съм го гледал и т.н. Намирам тази информация за много странна, защото там виждам обучения, за които нямам никакъв спомен |
messages.csv | Много подредена информация кога, с кой и какви съобщения сме си разменили. Един от най-полезните файлове поне за мен, защото ми позволява бързо и лесно да намирам информация. Например някой ми е задал въпрос за пивот таблици, аз съм му отговорил и след няколко месеца получавам подобен въпрос. Мога по ключови думи лесно да намеря старата кореспонденция във файла и да изпратя отговора, което ми спестява немалко време. Хубавото е, че информацията се пази доста дълго – при мен от 2017г. Лошото е, че ако съобщенията са на кирилица – не се четат. НО аз знам начин как да си ги прочетем с помощта на … Power Query |
PhoneNumbers.csv | Съхраняват се някакви телефонни номера, но при мен това е празно |
Positions.csv | Позициите, които съм отбелязал в LI, че съм заемал. Информация, която е налична и в профила ми |
Profile.csv | Информацията, която се вижда в профила ми в LI. Каквото е попълнено от: First Name,Last Name,Maiden Name,Address,Birth Date,Headline,Summary,Industry,Zip Code,Geo Location,Twitter Handles,Websites,Instant Messengers |
Receipts.csv | Явно е за получаване / изпращане на пари, но при мен е празно |
Recommendations Given.csv | Какви препоръки съм дал на хора в LI: Имената на човека, актуална компания и длъжност, текст на препоръката и дата. |
Registration.csv | Датата, на която съм се регистрирал в LI и от какво IP |
Rich Media.csv | Това е интересно – файлът съдържа линк, от който можем да свалим снимки, които сме качили в LI като пост. Има такъв и за видеата. Информацията изглежда се пази 6 месеца |
Skills.csv | Списък с всички умения, които съм посочил в профила си в LI |
Teammates.csv | Тук изглежда се пази информация за хората, които съм посочил, че са ми колеги. Но там имам само два записа и нямам представа каква е логиката на тази информация |
Videos.csv |
Линк за сваляне на видеа, които съм качил в LI. Каква е разликата с Rich Media – не зная |
В следваща статия ще покажа как лесно текстовете на кирилица, които иначе излизат на неразбираеми символи могат да бъдат „дешифрирани“ с помощта на Ексел и Power Query.