10 häufig gestellte Fragen zum Vorstellungsgespräch für Data Scientist

Das Gebiet der Datenwissenschaft entwickelt sich ständig weiter, deckt mehrere Branchen ab und erfordert umfangreiche Kenntnisse in den Bereichen Mathematik, Statistik, Programmierung und Marketing. Datenwissenschaftler zu werden, erfordert eine beeindruckende Mischung aus technischen Fähigkeiten, Kreativität und Kommunikation.

Die Stellenbeschreibungen für Datenwissenschaftler können sehr unterschiedlich sein, obwohl alle Bewerber mit einer langen Liste der begehrtesten beruflichen Fähigkeiten wie kritisches Denken, Problemlösung, Datenanalyse, emotionale Intelligenz, Liebe zum Detail und Teamwork suchen. Dies bedeutet, dass Interviewfragen für Datenwissenschaftler mehrere unterschiedliche Themen umfassen können und von typischen Soft Skills-Fragen bis hin zu äußerst technischen Diskussionen reichen.

Datenwissenschaftliche Interviews erfordern viel Vorbereitung. Unabhängig davon, ob Sie gerade eine erstklassige Informatikschule abgeschlossen haben oder in ein anderes Unternehmen oder eine andere Branche wechseln möchten, sollten Sie sich Zeit nehmen, um die wichtigsten Konzepte Ihrer Arbeit zu besprechen. Genau wie Sie wissen, wie man fährt, aber möglicherweise Probleme haben, bestimmte Straßenregeln zu wiederholen, können Sie in einem Interview stecken bleiben und versuchen, zu artikulieren, wie ein bestimmter Algorithmus funktioniert.

Zur Vorbereitung haben wir 10 der häufigsten Fragen zu Vorstellungsgesprächen für Data Scientists zusammengestellt. Von frühen Filmvorführungen über Video- und Vor-Ort-Interviews in der zweiten und dritten Phase bis hin zu einer Vielzahl von Untersuchungen in Bezug auf Ihre technischen Fähigkeiten, Kommunikationsfähigkeiten und Ihren Arbeitsstil.

1. 'Erzählen Sie uns mehr über das neueste Projekt in Ihrem Portfolio.'

Datenwissenschaftler sind in vielen verschiedenen Branchen gefragt, aber Unternehmen suchen häufig jemanden mit sehr spezifischen Fähigkeiten und einer guten kulturellen Passform. Ein detailliertes Online-Portfolio, das die Art der Arbeit anzeigt, zu der Sie in der Lage sind, sowie eine starke Präsenz in den sozialen Medien und eine persönliche Marke, helfen Ihnen dabei, sich von anderen Bewerbern abzuheben und Sie mit Einstellungsmanagern und Personalvermittlern in Verbindung zu bringen, damit Sie perfekte Jobs finden geeignet zu.

Bereiten Sie sich in einem datenwissenschaftlichen Interview darauf vor, ausführlich über alle Elemente Ihres Lebenslaufs, Portfolios oder Ihrer Website zu sprechen. Passen Sie Ihre Antwort auf ein Projekt an Ihr Publikum an. Wenn es sich um ein erstes Screening oder ein Panel mit Teilnehmern aus verschiedenen Abteilungen handelt, sollten Sie sich darauf konzentrieren, wie Ihre Arbeit zu positiven Ergebnissen für den Kunden und sein Geschäft geführt hat.

Wenn Sie zu dem Teil des Interviewprozesses gelangen, in dem Sie sich mit einem anderen Datenwissenschaftler, Ingenieur, Analysten oder einer anderen technischen Person treffen, ist eine detailliertere Beschreibung der Daten und Prozesse erforderlich, die mit Ihrer Arbeit verbunden sind.

2. "Warum wollen Sie für dieses Unternehmen arbeiten?"

Auch wenn Sie direkt über Ihr Online-Portfolio oder LinkedIn-Profil kontaktiert und zu einem Vorstellungsgespräch für eine offene Position eingeladen wurden, möchte das Unternehmen wissen, warum Sie zugesagt haben und warum Sie der Meinung sind, dass Sie für den Job gut geeignet sind.

Abgesehen von der Auffrischung Ihrer technischen Fähigkeiten sollte Ihre Vorbereitung auf das Vorstellungsgespräch auch Nachforschungen über das Unternehmen umfassen, bei dem Sie sich bewerben. Informationen über ihre Branche, Mission, Mitarbeiter, genau das, was sie tun und wie gut sie damit umgehen, helfen Ihnen dabei, eine spezifisch zugeschnittene Antwort auf diese Frage zu finden.

Stellen Sie fest, wie Ihre Fähigkeiten ihnen helfen, ihre Ziele zu erreichen. Finden Sie einen Weg, Ihre Leidenschaft für einen oder mehrere Aspekte Ihrer beruflichen Rolle auszudrücken, einschließlich der Mission, Philosophie, Innovation oder Produktlinie des Unternehmens. Wenn dies Ihr Traumjob ist, kann es sich lohnen, vor dem Vorstellungsgespräch ein Data-Science-Projekt zusammenzustellen, das ein Problem für sie löst - wie das Ansprechen auf eine neue demografische Gruppe oder das effizientere Planen von Lieferungen.

3. 'Nennen Sie die Datenwissenschaftler, die Sie am meisten bewundern, und erklären Sie, warum.'

Dies ist zwar eine sehr persönliche Frage, die technisch nicht richtig beantwortet werden kann, aber die Antworten, die Sie auswählen, sind sehr wichtig. Ihre Recherchen über das Unternehmen sowie die im Interviewpanel können Ihnen helfen, allein mit dieser Frage einen guten ersten Eindruck zu hinterlassen.

Wenn Sie die Fachleute kennen und die Wellen schlagen, werden Sie den Interviewern zeigen, dass Sie sich mit der Branche auskennen und sie leidenschaftlich lieben. Es ist nützlich, über Datenwissenschaftler zu diskutieren, die in dem jeweiligen Berufsfeld, für das Sie sich bewerben, wie Finanzen, Medizin oder Börse, geschätzt werden.

Diese Frage ist mehr als nur eine beeindruckende Liste von Namen. Der "Warum" -Teil der Gleichung zeigt Ihren potenziellen Arbeitgebern auch, was Sie in Ihrem Bereich schätzen und wie Sie Ihre Arbeit angehen. Wenn Ihre Recherchen ergeben haben, dass das Unternehmen Wert auf Innovation, Integrität oder sogar eine bestimmte statistische Methode legt, ist dies eine hervorragende Gelegenheit, um mitzuteilen, dass Sie dieselben Werte teilen.

4. 'Wie würden Sie jemandem aus der Marketingabteilung eine Empfehlungsmaschine erklären?'

Eine der wichtigen Eigenschaften, die Data Scientists von anderen technischen Genies unterscheidet, ist die Fähigkeit, Daten so zu konvertieren, anzuzeigen und zu erklären, dass auch nicht-technische Personen sie verstehen können. Dies macht eine Abfrage wie diese zu einer der wichtigsten Interviewfragen für Datenwissenschaftler, auf die Sie stoßen werden. Interviewer möchten sehen, wie gut Sie Konzepte wie Datenmodellierung, Entscheidungsbäume und lineare Regression einem Publikum vermitteln können.

In diesem speziellen Fall möchten Sie zunächst anhand von Beispielen für inhaltsbasiertes Filtern und für kollaboratives Filtern in einfachen Worten erläutern, wie ein Empfehlungsmodul funktioniert. Anschließend möchten Sie besprechen, wie Sie mit der Marketingabteilung zusammenarbeiten können, um ihre Fähigkeiten zur Kundenansprache mit der Leistungsfähigkeit des Algorithmus zu kombinieren, der gesammelte Daten verwendet, um herauszufinden, was die Verbraucher wünschen.

5. "Was sind die Unterschiede zwischen überwachtem und unbeaufsichtigtem Lernen?"

Sie können zunächst zusammenfassen, dass der Hauptunterschied zwischen diesen beiden Methoden darin besteht, dass das überwachte Lernen Trainingsdaten enthält, aus denen der Algorithmus lernen und Antworten liefern kann. Unüberwachtes Lernen erfordert die Gruppierung von Dingen nach Ähnlichkeiten, häufigen Anomalien und anderen Mustersuchprozessen und nicht nach harten und schnellen Daten.

Der Interviewer möchte, dass Sie näher darauf eingehen. Es ist daher wichtig, die spezifischen Unterschiede aufzulisten und über die verschiedenen verwendeten Algorithmen sprechen zu können.

Überwachtes Lernen

  • Verwendet bekannte und gekennzeichnete Daten als Eingabe
  • hat einen Feedback-Mechanismus
  • zur Vorhersage verwendet
  • Zu den gebräuchlichen Algorithmen gehören Entscheidungsbaum, logistische Regression, lineare Regression, Support Vector Machine und Random Forest

Unbeaufsichtigtes Lernen

  • Verwendet unbeschriftete Daten als Eingabe
  • hat keinen Rückkopplungsmechanismus
  • zur Analyse verwendet
  • Zu den gebräuchlichen Algorithmen gehören K-Means-Clustering, hierarchisches Clustering, Autoencoder und Zuordnungsregeln

Sie möchten einige Beispiele haben, entweder allgemein oder aus einem bestimmten Projekt, an dem Sie gearbeitet haben, um die Unterschiede zwischen diesen beiden Arten des maschinellen Lernens zu veranschaulichen und in welchen Fällen sie jeweils verwendet werden könnten. Zum Beispiel kann unbeaufsichtigtes Lernen verwendet werden, wenn ein neues Produkt auf den Markt gebracht wird, bei dem die Demografie des Kunden, für den es attraktiv sein könnte, unbekannt ist.

Abonnieren

Melden Sie sich für unseren Newsletter an und erhalten Sie 20% RABATT auf unseren Karrieretest!

Abonnieren

6. 'Wie vermeidet man Selektionsverzerrungen?'

Diese Frage kann in einem datenwissenschaftlichen Interview viele Formen annehmen. Möglicherweise werden Sie gebeten, eine Auswahlverzerrung zu definieren, wie sie vermieden werden kann, oder ein konkretes Beispiel dafür zu geben, wie sie in einem Projekt, an dem Sie gearbeitet haben, eine Rolle spielte.

Das Hauptproblem bei der Auswahlverzerrung ist, dass Schlussfolgerungen aus einer nicht zufälligen Stichprobe gezogen wurden. Offensichtlich ist die einfachste Lösung, immer aus einer Zufallsstichprobe einer klar definierten Grundgesamtheit auszuwählen. Sie müssen herausfinden, warum dies nicht immer möglich ist.

Beachten Sie, dass eine gezielte Auswahl - mit der Absicht, eine vorgefasste Theorie oder Projektion zu beweisen - oder eine Dateneliminierung erfolgen kann. Dies könnte eine indirekte Möglichkeit für das Einstellungsgremium sein, eine dieser schwierigen Interviewfragen zu Ethik und Integrität bei der Arbeit zu stellen .

Letztendlich möchten Sie betonen, wie häufig es sich bei Auswahlverzerrungen um unbeabsichtigte oder unvermeidlich verzerrte Daten handelt. Gehen Sie unbedingt auf einige Bereiche ein, in denen Selektionsverzerrungen auftreten können, einschließlich Abtastung, Zeitintervall, Daten und Abrieb. Geben Sie anschließend einige Beispiele dafür, wie Sie mithilfe von Techniken wie Resampling und Boosten nicht-zufällige Samples umgehen können.

Wenn Sie sich in einem Teil eines Interviews befinden, während Sie mit Vertretern aus weniger technischen Abteilungen sprechen, verwenden Sie ein leicht verständliches Beispiel, das die Vorurteile in Bezug auf die Auswahl klar verdeutlicht. Der Datenwissenschaftler Eric Hollingsworth verweist auf eine Lehre aus dem Ausbruch der Vogelgrippe im Jahr 2011, bei der in einer statistischen Stichprobe von „bestätigten Fällen“ „nur sehr kranke Personen“ gezählt wurden. Die resultierenden 80% berichteten über die Todesrate, die so schlimm aufgrund von Selektionsverzerrungen war, dass sie weit verbreitete Befürchtungen hervorriefen.

7. 'Wie können Ausreißer behandelt werden?'

Dies ist eine häufig gestellte Frage für Datenwissenschaftler, da sie aufzeigt, wie Sie die von Ihnen angegebenen Daten verwenden, welche Methoden Sie zur Verarbeitung dieser Daten verwenden und ob Sie bereit sind, die Zeit für die Auswertung der einzelnen Daten zu verwenden.

Sie möchten zuerst darüber sprechen, was einen Ausreißer ausmacht, als Zahlen, die weit außerhalb des Datenclusters in einem Diagramm existieren, als 2-3 Standardabweichungen vom Mittelwert und so weiter. Der nächste Schritt zum Umgang mit Ausreißern ist die Bewertung, warum sie passiert sind.

Eine kleine Anzahl von Ausreißern, die auf einfache menschliche oder maschinelle Fehler zurückzuführen sind, kann leicht beseitigt werden. Beachten Sie jedoch, dass selbst ein Ausreißer eher ein Schlüsseldatenpunkt als ein Problem sein kann, da er möglicherweise den Erfolg einer einzelnen Marketingtaktik, eines neuen Wirkstoffs oder einer neuen Produktlinie anzeigt.

Als Nächstes möchten Sie erklären, wie Sie mit einer großen Anzahl von Ausreißern umgehen, was komplexere Lösungen erfordert. Möglicherweise müssen Sie das verwendete Modell ändern, die Daten auf den Durchschnitt normieren oder einen zufälligen Gesamtstrukturalgorithmus verwenden. Versuchen Sie noch einmal, anhand eines realen Falls aus Ihrer Erfahrung als Datenwissenschaftler die richtige Taktik zu erklären.

8. 'Warum ist die Datenbereinigung wichtig?'

Das Sammeln und Löschen von Daten ist ein wichtiger Bestandteil Ihrer Arbeit als Datenwissenschaftler und nimmt bis zu 80% Ihrer Zeit in Anspruch. Unabhängig davon, für welche Branche Sie sich bewerben, enthalten die Interviewfragen immer eine Frage, warum die Datenbereinigung wichtig ist. Die Interviewer werden auch nach Ihren bevorzugten Reinigungstechniken und -programmen fragen.

Sie sollten betonen, wie sauber die Daten sein müssen, um die richtigen Schlussfolgerungen zu ziehen, aber es geht nicht nur um die Zahlen. Erläutern Sie, wie sich das Beginnen mit vollständigen, genauen, gültigen und einheitlichen Daten direkt auf das Geschäft auswirkt. Zu den wichtigsten Vorteilen gehören:

  • verbesserte Entscheidungsfindung über Unternehmensziele
  • Schnellere Kundenakquise und Neuausrichtung von Kunden in der Vergangenheit
  • Zeit- und Ressourcenersparnis durch Beseitigung ungenauer oder doppelter Daten
  • verbesserte Produktivität
  • Verbesserte Teammoral dank wiederholter effizienter und genauer Ergebnisse

9. "Was ist das Ziel von A / B-Tests?"

Fragen zu A / B-Tests während Ihres Interviews für eine Position als Datenwissenschaftler beginnen möglicherweise mit einem allgemeineren Verweis auf die Verwendung des experimentellen Designs zur Beantwortung einer einzelnen Frage zum Benutzerverhalten oder zu Benutzervorgaben. Das Ziel beim Testen einer Website-, App- oder Newsletter-Designvariablen besteht ganz einfach darin, zu bewerten, ob eine Änderung die Zinsen, das Engagement und die Conversion-Raten erhöht.

Eine Möglichkeit, sich bei der Beantwortung dieser Art von Interviewfragen abzuheben, besteht darin, zu diskutieren, wie andere Datenwissenschaftler aus A / B-Tests möglicherweise die falschen Schlussfolgerungen ziehen. Mögliche Fallstricke sind:

  • Nicht genügend Daten über einen ausreichend langen Zeitraum gesammelt
  • zu viele Variablen gleichzeitig testen
  • Nicht berücksichtigt werden externe Faktoren, die den Datenverkehr während des Testzeitraums beeinflussen können
  • Ignorieren Sie kleine Gewinne, die sich im Laufe der Zeit aufbauen können, und kombinieren Sie sie mit anderen positiven Veränderungen, um den Umsatz zu steigern
  • fehlende Gesamtinterpretationen wie Nettofinanzgewinne oder -verluste im Verhältnis zu den Umrechnungskursen

Abgesehen davon, dass Sie auf diese Probleme hingewiesen haben, müssen Sie angeben, wie Sie sie lösen würden - oder besser gesagt, wie Sie sie bereits in Ihren vorherigen Data-Science-Projekten vermieden haben.

10. "Sie haben 48 Stunden Zeit, um diese Codierungsaufgabe zu lösen."

Die Codierungsherausforderung kann eine erste Möglichkeit sein, potenzielle Datenwissenschaftler zu überprüfen, oder es kann ein zweiter Schritt im Interviewprozess sein, nachdem Sie die erste Hürde mit einem Personalvermittler oder Personalmanager genommen haben. Dies kann ein Vor-Ort-Test sein, der 30 Minuten bis 2 Stunden dauert und bei dem Sie in Sichtweite des Interviewers auf einem Whiteboard oder einer Tastatur codieren. Oft haben Sie die Wahl zwischen verschiedenen Sprachen. Sie müssen jedoch darauf vorbereitet sein, in SQL oder Python zu programmieren.

Einige Unternehmen vergeben längere Aufgaben mit Fristen von bis zu einer Woche. Whiteboard-Herausforderungen erfordern möglicherweise das Schreiben relativ einfacher SQL-Abfragen, längere Tests sind jedoch natürlich komplexer. In der Regel erhalten Sie Daten und werden aufgefordert, anhand dieser Daten bestimmte Vorhersagen zu treffen, und Sie müssen Ihre Arbeit zeigen. Beispielsweise erhielt ein kürzlich von einem Datenwissenschaftler befragtes Thema Airbnb-Daten und wurde gebeten, die Immobilienpreise anhand der Unterkunftsmerkmale vorherzusagen.

Die Interviewer möchten Ihre Auswahl mit Ihnen besprechen, die getroffenen Annahmen, die von Ihnen gewählten Funktionen, die Gründe für die Verwendung bestimmter Algorithmen und vieles mehr. Oft ist die Antwort, die Sie erhalten, weniger wichtig als Ihr Prozess, Ihre Kreativität, Ihre Lesbarkeit und Ihr Design.

Dies kann ein nervenaufreibendes Interviewerlebnis sein. Bereiten Sie sich also darauf vor, indem Sie mit Freunden oder Kollegen aus dem Bereich Data Science Herausforderungen für die Codierung von Übungen erstellen und abschließen. Sie können auch Websites wie Leetcode und SQLZOO für Codierungsübungen besuchen. Aktuelle Scheininterviews zu Problemen mit Algorithmen und dem Systemdesign sind kostenlos über Interviewing.io erhältlich.

Wie Sie sehen, können Interviewfragen für Datenwissenschaftler schwierig und der gesamte Prozess langwierig und anstrengend sein. Einer der wichtigsten Interviewtipps ist, positiv zu bleiben, auch wenn Sie der Meinung sind, dass ein Teil des Interviewprozesses schlecht verlaufen ist. Wir sind oft härter für uns selbst als andere, und Sie könnten den Job trotzdem bekommen, obwohl nicht jede Antwort so perfekt ist, wie Sie es sich gewünscht hätten.

Wenn Sie die Gelegenheit verpassen, bitten Sie um Feedback und nutzen Sie es, um Ihre nächste Interviewerfahrung zu verbessern. Immerhin wurden viele etablierte Datenwissenschaftler aus mehreren Positionen abgelehnt und erzielten weiterhin Erfolge in den Jobs, die letztendlich besser zu ihnen passten!

Auf welche Fragen und Herausforderungen beim Programmieren stießen Sie, als Sie versuchten, einen Job im Bereich Data Science zu bekommen? Nehmen Sie an der Diskussion in den Kommentaren unten teil und helfen Sie Ihren Kollegen, sich auf das nächste Interview vorzubereiten!

Lassen Sie Ihren Kommentar

Please enter your comment!
Please enter your name here