I was invited by UvA’s Information, Communication and the Data Society (ICDS) to participate in a panel at the Conference on Privacy and Data Protection, which was focused on AI.
The recording of the panel is now online, watch me telling a room full of (highly) privacy-aware (and cookie-averse) people that Cambridge Analytica nudging people to “politically activate them” with tailored information can be a “democratic good” 😅.
For the Media Perspectives (“platform for media & innovation”) newsletter I wrote a column on the future of media & AI: Algoritmewijsheid. Read it below (in Dutch):
Enjoyed giving a lecture at the SIKS Course “Advances in Information Retrieval” at the Mitland Hotel in Utrecht. I also pitched DIR 2019 😅 (as evidenced by the picture above from Arjen). See my slidedeck below!
This talk is loosely based on (part of) the talk I gave at the ACM RecSys Summerschool, but I added a few slides on dealing with implicit feedback (= clicks), and popularity bias.
Oberon Berlage recently successfully defended his MSc. thesis (title above!) for the Data Science Master at University of Amsterdam, and graduated with a whopping 9!
He’s the first academic offspring of our AI Team @ FD Mediagroep, and worked on BNR SMART Radio‘s segmenter. Oberon improved our text-based segmenter by adding audio embeddings, improving the F1 score with +32%!
Yesterday BNR SMART Radio won two Dutch Interactive Awards (DIA 2019) Awards! We were nominated together with Elastique, the folks who designed the UX/interface of our BNR SMART Radio app which you can download here (or in your app stores, both Android/iOS)!
🥇 Content
We won Gold in the category “Content”. Why, you may ask?
“Finally a reason to listen to Radio in general, and BNR in particular. Because advertising is absent and topics are tailored to the personal taste of the listener, who can search in a targeted way and express appreciation for a broadcast through a thumbsup, they reach new target audiences online.”
Next to this, we also won the Silver DIA2019 Award in the category “Disruptor”!
“In a world where radio has never deviated from the linear model, the jury finds this very disruptive. SMART Radio provides a personal radio experience and possibly a new revenue model in the long term. The jury members find the potential of the underlying strategy even more impressive. What if BNR joins forces with FD Mediagroep and combines the work of both parties in this? The jury sees all kinds of opportunities to fit in new forms of advertising (or to omit them). The collaboration between the agency and the media company has resulted in something that has never been seen before.”
After winning the Marconi award for radio innovation, yesterday we picked up the AMMA Award for Media Innovation for our news personalization efforts at FD Mediagroep (both SMART Journalism for Het FD and SMART Radio for BNR Nieuwsradio)!
It’s really great to see that our current investment into AI and innovation seems to resonate with the outside world 🤖. And I am really happy to be with a company that sees this development as such an important direction that we are able to work with a big and talented team of data scientists, interns, engineers, and product folks 🤓
I wrote a response on recent coverage around the alleged ‘promotion’ of anti-vax books by bol.com, suggesting it is due to “influential, steering, algorithms.” In this piece I state it’s not an issue of algorithms, but of long-tail, obscure, content. My response was published in Het Parool, as an edited letter. Read the original, unedited piece (in Dutch) below.
Together with Anne Schuth and Daan Odijk I’ll be co-organizing The Dutch-Belgian Information Retrieval workshop (DIR 2019). At DIR 2018, we sat down during lunch and came up with the following plan:
#DIR2019 will try something new. Top ranked IR papers from WWW, WSDM, CIKM, NeurIPS, RecSys, CHI, CHIIR, KDD, ECIR, ACL, EMNLP (in no particular order, open to suggestions) with authors in NL & BE will be invited to present their work in a lightning talk⚡#DIR2018
— DIR 2019 – Lightning talk Edition (@dir_2019) 23 november 2018
We also decided on a date: November 29, 2019!
For now, the most import work is done (designing a logo, and setting up our Twitter account ;-)). Stay tuned for more, later! And follow @dir_2019 for now ⚡.
SMART Radio is the first product that comes out of our FD Mediagroup AI team! SMART Radio is released in beta for iOS (anytime) and Android, give it a try by downloading it here: https://bnr.nl/smartradio.
Image: BNR
Read more about SMART Radio in our demo paper, presented at DIR 2018:
Yesterday I gave a (tongue-in-cheek) talk on algorithmic personalization at the VOGIN-IP Lezing 2018, and brought five pieces of evidence to prove the “filter bubble” doesn’t exist. Check out my slides (in Dutch) by clicking on the picture below!
For Company.info I wrote a short blog post explaining the current state-of-the-art, our current, and future projects that involve machine learning and company information. Read the post below! (in Dutch).
Voorspellende inzichten uit bedrijfsinformatie
Machine learning stelt ons in staat om geautomatiseerd en op grote schaal voorspellende inzichten uit de grote verzameling data uit bijvoorbeeld jaarverslagen en jaarrekeningen te ontdekken en te ontsluiten.
Jaarverslagen bieden waardevolle inzichten in het functioneren en de toekomstperspectieven van bedrijven. Zo ontdekte het FD uit het jaarverslag dat Blendle in 2018 naar nieuw kapitaal op zoek moet om voort te kunnen bestaan. Ook publiceerde het FD een onderzoek in samenwerking met Company.info waaruit bleek dat een groot aantal bedrijven hun interne beheersing niet op orde hebben. Zulke inzichten kunnen volgen uit simpele zoekopdrachten in jaarverslagen.
Zelf onderzoek doen?
Met meer dan 1.7 miljoen originele jaarverslagen is het eenvoudig grasduinen in jaarverslagen met Company.info. Zo levert een simpele zoekopdracht naar ‘toekomst onzeker’ of ‘oordeelonthouding’ in de verzameling jaarverslagen van Company.info op het moment van schrijven respectievelijk 31.267 en 18.231 resultaten op! Test het gratis.
Voorspellende inzichten met machine learning
De aanbevelingen van Netflix, autocorrecties van Google, of de zelfrijdende auto van Tesla; machine learning is niet meer weg te denken uit ons dagelijks leven. Ook in het domein van bedrijfsinformatie gaan de ontwikkelingen vliegensvlug. Machine learning stelt ons in staat om geautomatiseerd en op grote schaal voorspellende inzichten uit de grote verzameling bedrijfsinformatie en jaarverslagen van Company.info te ontdekken, en te ontsluiten.
Zo ontwikkelde Marcia Fissette een methode om te voorspellen of een bedrijf zich schuldig maakt aan fraude, op basis van de tekst uit een jaarverslag. Fissette verzamelde honderden jaarverslagen van (veroordeelde) frauderende bedrijven, en nog eens honderden jaarverslagen van niet-frauderende bedrijven. Door een algoritme het verschil te laten ontdekken tussen het taalgebruik van deze twee groepen jaarverslagen, was Fissette in staat om met een nauwkeurigheid van 89% de frauderende bedrijven te herkennen op basis van hun jaarverslag, en factoren zoals de sector waarin het bedrijf actief is, en de omvang van het bedrijf.
Een volgende stap is het voorspellen van de toekomstige financiële situatie van een bedrijf. Onderzoekers van Amazon en Euclidean Technologiestoonden aan dat ze toekomstige balans- en kengetallen (zoals eigen vermogen, activa, en verschillende ratio’s) kunnen voorspellen op basis van (historische) kengetallen, afkomstig uit gepubliceerde jaarrekeningen. Daarnaast tonen ze een mogelijke toepassing van deze voorspellingen aan: aandelenportefeuilles die zijn samengesteld op basis van de voorspelde financiële getallen — in plaats van de al gepubliceerde getallen — leveren een substantieel hoger rendement op in (gesimuleerde) aandelenhandel.
Machine learning bij Company.info
Company.info zit bovenop de ontwikkelingen binnen het toepassen van machine learning om voorspellende inzichten te verkrijgen.
Zo lanceerden we afgelopen maart onze volledig geautomatiseerde nieuws monitor: met behulp van machine learning herkent Company.info automatisch bedrijfsnamen in nieuwsartikelen, en weet automatisch de juiste bedrijfsprofielen aan de artikelen te koppelen. Daarnaast zetten we machine learning in om geautomatiseerd bedrijfsprofielen met SBI-codes te verrijken.
En we zitten niet stil; we volgen alle ontwikkelingen op de voet, en zijn druk bezig met het ontwikkelen van nieuwe voorspellende modellen. Zo gaan we met behulp van tekst-classificatiealgoritmen een sentimentscore aan nieuwsartikelen toekennen, waarmee we patronen en ontwikkelingen kunnen ontdekken in het sentiment rond sectoren of bedrijven. Ook kijken we naar het voorspellen van financiële kengetallen.
David Graus is een data scientist bij Company.info met een PhD in Information Retrieval from ILPS (University of Amsterdam). Hij heeft een achtergrond in de media en in het huidige tijdperk waarin technologie vele aspecten van het leven raakt, voelt hij een verantwoordelijkheid als data scientist om uit te leggen over zijn werk en expertise.
Here are the slides of a talk I gave at the Data Science Northeast Netherlands Meetup and PyData, where I detail the custom in-house entity linking framework, sentiment analysis, and entity salience scoring model we developed for Company.info (part of FD Mediagroep), in addition to showing some example applications of our corpus of news articles linked to organization profiles.
I’m sharing it here because I think it’s cool, since it’s one of the first project I’ve done at Company.info! Gives you some idea of what we’re working on..
Thursday 19 October, I had the pleasure of hosting the 8th Recommender Systems Amsterdam meetup at FDMG/Company.info. The meetup’s theme was media-content recsys, and we had three talks from industry, dealing with recommending tv programs, music videos, and text articles);
Ghida Ibrahim (Senior Data Scientist, (formerly at) Liberty Global): “Recommender systems for video and TV products”
Bouke Huurnink and Roman Ivanov (XITE): “Music Video Recommendation@XITE”
Robbert van der Pluijm (Head of Bibblio Labs, Bibblio): “Scaling a recommendation service – a threefold story”
Voor de debatavond De Macht van Data gaf ik een korte inleiding over algoritmen. Wat is een algoritme? Hoe werkt een algoritme? En waar komen we algoritmen tegen?