“RecSys in the Media Industry” Lecture at RecSys Summer School

πŸ“… September 11, 2019 β€’ πŸ• 13:39 β€’ 🏷 Blog β€’ πŸ‘ 100

With Daan Odijk I gave a lecture + hands-on workshop at the ACM Summer School on Recommender Systems in Gothenburg, Sweden on RecSys in the Media Industry: Relevance, Recency, Popularity, and Diversity.

πŸ“Έ by Alan Said

For it, we had a long (90+ min) lecture combining insights, experiences, and projects from our work at RTL and Blendle (Daan), and FD Mediagroep (me).

In addition, we did a small hands-on workshop, implementing a content-based re-ranker for WikiNews.

See our slides and notebooks here: https://github.com/graus/recsys_summer_school/

See a tweet by @alansaid, here:

Finally, see my slidedeck here:

“Improving automated segmentation of radio shows with audio embeddings”

πŸ“… July 5, 2019 β€’ πŸ• 15:41 β€’ 🏷 Blog and Research β€’ πŸ‘ 81

Update (28/1/2020): Oberon’s thesis was accepted and will be published at the IEEE 45th International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2020), to be held May 4-8 in Barcelona, Spain! The submission is co-authored with Klaus Lux and myself.

Oberon Berlage recently successfully defended his MSc. thesis (title above!) for the Data Science Master at University of Amsterdam, and graduated with a whopping 9!

He’s the first academic offspring of our AI Team @ FD Mediagroep, and worked on BNR SMART Radio‘s segmenter. Oberon improved our text-based segmenter by adding audio embeddings, improving the F1 score with +32%!

His thesis is now online, check it out at: http://scriptiesonline.uba.uva.nl/document/673254

Dutch Interactive Awards (2x) for BNR SMART Radio!

πŸ“… June 28, 2019 β€’ πŸ• 10:17 β€’ 🏷 Blog β€’ πŸ‘ 57

Yesterday BNR SMART Radio won two Dutch Interactive Awards (DIA 2019) Awards! We were nominated together with Elastique, the folks who designed the UX/interface of our BNR SMART Radio app which you can download here (or in your app stores, both Android/iOS)!

πŸ₯‡ Content

We won Gold in the category “Content”. Why, you may ask?

β€œFinally a reason to listen to Radio in general, and BNR in particular. Because advertising is absent and topics are tailored to the personal taste of the listener, who can search in a targeted way and express appreciation for a broadcast through a thumbsup, they reach new target audiences online.”

jury report (source: emerce)

πŸ₯ˆ Disruptor

Next to this, we also won the Silver DIA2019 Award in the category “Disruptor”!

“In a world where radio has never deviated from the linear model, the jury finds this very disruptive. SMART Radio provides a personal radio experience and possibly a new revenue model in the long term. The jury members find the potential of the underlying strategy even more impressive. What if BNR joins forces with FD Mediagroep and combines the work of both parties in this? The jury sees all kinds of opportunities to fit in new forms of advertising (or to omit them). The collaboration between the agency and the media company has resulted in something that has never been seen before.”

jury report (source: emerce)

Current standing

For who has trouble keeping track πŸ˜…, these are the awards we won with SMART Radio:

πŸ† Marconi Online Award
πŸ† AMMA Award (with SMART Journalism)
πŸ† DIA2019 Award, category: Content
πŸ₯ˆ DIA2019 Award, category: Disruptor

We won the AMMA Media-innovation award for our News Personalization projects at FD Mediagroep!

πŸ“… May 17, 2019 β€’ πŸ• 13:50 β€’ 🏷 Blog β€’ πŸ‘ 49

After winning the Marconi award for radio innovation, yesterday we picked up the AMMA Award for Media Innovation for our news personalization efforts at FD Mediagroep (both SMART Journalism for Het FD and SMART Radio for BNR Nieuwsradio)!

It’s really great to see that our current investment into AI and innovation seems to resonate with the outside world πŸ€–. And I am really happy to be with a company that sees this development as such an important direction that we are able to work with a big and talented team of data scientists, interns, engineers, and product folks πŸ€“

Een lijstje zoekresultaten is geen etalage

πŸ“… March 23, 2019 β€’ πŸ• 10:00 β€’ 🏷 Blog and Media and Writing β€’ πŸ‘ 357

I wrote a response on recent coverage around the alleged ‘promotion’ of anti-vax books by bol.com, suggesting it is due to “influential, steering, algorithms.” In this piece I state it’s not an issue of algorithms, but of long-tail, obscure, content. My response was published in Het Parool, as an edited letter. Read the original, unedited piece (in Dutch) below.

(more…)

Co-organizing DIR 2019!

πŸ“… February 8, 2019 β€’ πŸ• 14:18 β€’ 🏷 Blog β€’ πŸ‘ 61

Together with Anne Schuth and Daan Odijk I’ll be co-organizing The Dutch-Belgian Information Retrieval workshop (DIR 2019). At DIR 2018, we sat down during lunch and came up with the following plan:

We also decided on a date: November 29, 2019!

For now, the most import work is done (designing a logo, and setting up our Twitter account ;-)). Stay tuned for more, later! And follow @dir_2019 for now ⚑.

BNR SMART Radio wins the Marconi Online Award!

πŸ“… February 1, 2019 β€’ πŸ• 16:17 β€’ 🏷 Blog β€’ πŸ‘ 95

Really happy and proud of our amazing AI team for winning the (first) Marconi Online Award at the Gouden RadioRing Gala, for BNR SMART Radio!

SMART Radio is the first product that comes out of our FD Mediagroup AI team! SMART Radio is released in beta for iOS (anytime) and Android, give it a try by downloading it here: https://bnr.nl/smartradio.

Image: BNR

Read more about SMART Radio in our demo paper, presented at DIR 2018:


The Filter Bubble doesn’t exist!

πŸ“… March 29, 2018 β€’ πŸ• 13:29 β€’ 🏷 Blog β€’ πŸ‘ 510

Yesterday I gave a (tongue-in-cheek) talk on algorithmic personalization at the VOGIN-IP Lezing 2018, and brought five pieces of evidence to prove the “filter bubble” doesn’t exist. Check out my slides (in Dutch) by clicking on the picture below!

Predictive insights from company information (blog post for company.info)

πŸ“… January 31, 2018 β€’ πŸ• 11:59 β€’ 🏷 Blog β€’ πŸ‘ 8

For Company.info I wrote a short blog post explaining the current state-of-the-art, our current, and future projects that involve machine learning and company information. Read the post below! (in Dutch).

Voorspellende inzichten uit bedrijfsinformatie

Machine learning stelt ons in staat om geautomatiseerd en op grote schaal voorspellende inzichten uit de grote verzameling data uit bijvoorbeeld jaarverslagen en jaarrekeningen te ontdekken en te ontsluiten.

Jaarverslagen bieden waardevolle inzichten in het functioneren en de toekomstperspectieven van bedrijven. Zo ontdekte het FD uit het jaarverslag dat Blendle in 2018 naar nieuw kapitaal op zoek moet om voort te kunnen bestaan. Ook publiceerde het FD een onderzoek in samenwerking met Company.info waaruit bleek dat een groot aantal bedrijven hun interne beheersing niet op orde hebben. Zulke inzichten kunnen volgen uit simpele zoekopdrachten in jaarverslagen.

Zelf onderzoek doen?

Met meer dan 1.7 miljoen originele jaarverslagen is het eenvoudig grasduinen in jaarverslagen met Company.info. Zo levert een simpele zoekopdracht naar β€˜toekomst onzeker’ of β€˜oordeelonthouding’ in de verzameling jaarverslagen van Company.info op het moment van schrijven respectievelijk 31.267 en 18.231 resultaten op! Test het gratis.

Voorspellende inzichten met machine learning

De aanbevelingen van Netflix, autocorrecties van Google, of de zelfrijdende auto van Tesla; machine learning is niet meer weg te denken uit ons dagelijks leven. Ook in het domein van bedrijfsinformatie gaan de ontwikkelingen vliegensvlug. Machine learning stelt ons in staat om geautomatiseerd en op grote schaal voorspellende inzichten uit de grote verzameling bedrijfsinformatie en jaarverslagen van Company.info te ontdekken, en te ontsluiten.

Zo ontwikkelde Marcia Fissette een methode om te voorspellen of een bedrijf zich schuldig maakt aan fraude, op basis van de tekst uit een jaarverslag. Fissette verzamelde honderden jaarverslagen van (veroordeelde) frauderende bedrijven, en nog eens honderden jaarverslagen van niet-frauderende bedrijven. Door een algoritme het verschil te laten ontdekken tussen het taalgebruik van deze twee groepen jaarverslagen, was Fissette in staat om met een nauwkeurigheid van 89% de frauderende bedrijven te herkennen op basis van hun jaarverslag, en factoren zoals de sector waarin het bedrijf actief is, en de omvang van het bedrijf.

Een volgende stap is het voorspellen van de toekomstige financiΓ«le situatie van een bedrijf. Onderzoekers vanΒ AmazonΒ enΒ Euclidean TechnologiesΒ toonden aanΒ dat ze toekomstige balans- en kengetallen (zoals eigen vermogen, activa, en verschillende ratio’s) kunnen voorspellen op basis van (historische) kengetallen, afkomstig uit gepubliceerde jaarrekeningen. Daarnaast tonen ze een mogelijke toepassing van deze voorspellingen aan: aandelenportefeuilles die zijn samengesteld op basis van de voorspelde financiΓ«le getallen β€” in plaats van de al gepubliceerde getallen β€” leveren een substantieel hoger rendement op in (gesimuleerde) aandelenhandel.

Machine learning bij Company.info

Company.info zit bovenop de ontwikkelingen binnen het toepassen van machine learning om voorspellende inzichten te verkrijgen.

Zo lanceerden we afgelopen maart onze volledig geautomatiseerde nieuws monitor: met behulp van machine learning herkent Company.info automatisch bedrijfsnamen in nieuwsartikelen, en weet automatisch de juiste bedrijfsprofielen aan de artikelen te koppelen. Daarnaast zetten we machine learning in om geautomatiseerd bedrijfsprofielen met SBI-codes te verrijken.

En we zitten niet stil; we volgen alle ontwikkelingen op de voet, en zijn druk bezig met het ontwikkelen van nieuwe voorspellende modellen. Zo gaan we met behulp van tekst-classificatiealgoritmen een sentimentscore aan nieuwsartikelen toekennen, waarmee we patronen en ontwikkelingen kunnen ontdekken in het sentiment rond sectoren of bedrijven. Ook kijken we naar het voorspellen van financiΓ«le kengetallen.

David Graus is een data scientist bij Company.info met een PhD in Information Retrieval from ILPS (University of Amsterdam). Hij heeft een achtergrond in de media en in het huidige tijdperk waarin technologie vele aspecten van het leven raakt, voelt hij een verantwoordelijkheid als data scientist om uit te leggen over zijn werk en expertise.

Financial News Mining Talk @ PyData Hilversum edition

πŸ“… November 24, 2017 β€’ πŸ• 11:49 β€’ 🏷 Blog β€’ πŸ‘ 43

Here are the slides of a talk I gave at the Data Science Northeast Netherlands Meetup and PyData, where I detail the custom in-house entity linking framework, sentiment analysis, and entity salience scoring model we developed for Company.info (part of FD Mediagroep), in addition to showing some example applications of our corpus of news articles linked to organization profiles.

I’m sharing it here because I think it’s cool, since it’s one of the first project I’ve done at Company.info! Gives you some idea of what we’re working on..