Blog of a data person.
-
Mousetrap.js
-
TIL
-
Minimal Spanning Trees
-
BLOG
-
Best practices stink
-
BLOG
-
Stackoverflow: artifical artifical intelligence
-
TIL
-
Seeing Faces
-
TIL
-
Rock, Paper, Swirlies
-
BLOG
-
Label propagation
-
BLOG
-
Bacteria from the 7th Guest
-
BLOG
-
Rock Paper Scissors Lizard Spock
-
BLOG
-
Lanchesters' Battle Simulator
-
BLOG
-
Pyperclip
-
TIL
-
MatplotPong
-
TIL
-
Instructor classification with fields
-
SCRIPT
-
ZeroShot NER with GliNER
-
SCRIPT
-
Rename NER
-
SCRIPT
-
Embedding some texts
-
SCRIPT
-
spaCy phrases/noun chunks
-
SCRIPT
-
spaCy disable
-
SCRIPT
-
Today I Scripted
-
BLOG
-
Video game sales in the 80s
-
TIL
-
The making of Diablo
-
TIL
-
SciNCL
-
TIL
-
Tetris is NP-Hard
-
TIL
-
Searching for a better search box
-
BLOG
-
Documint
-
TIL
-
Keyboards, keyboards, keyboards
-
BLOG
-
Garage Points
-
TIL
-
Interpreting Eomji
-
TIL
-
The roll, yaw and pitch of strawberries.
-
TIL
-
Detecting Chessboards
-
TIL
-
Machine UnLearning for Harry Potter
-
TIL
-
Invasive species
-
TIL
-
Citrus Fruits
-
TIL
-
One Dimensional Word2Vec
-
TIL
-
Classification via Segmented Attention
-
TIL
-
Doppelganger Buildings
-
TIL
-
text2fabric
-
TIL
-
Plant datasets
-
TIL
-
The worst kind of duplicate
-
TIL
-
Sleep vs. Code
-
TIL
-
Memes and other strange images
-
TIL
-
Large Disagreement Modelling
-
BLOG
-
Rubik's TSNE
-
TIL
-
Human Label Variation Datasets
-
TIL
-
Wearables as a Multi-Model dataset
-
TIL
-
Low Light Computer Vision
-
TIL
-
Colorizing Mobile Websites
-
TIL
-
Automating Esports Commentary
-
TIL
-
Finding Text in Comic Books
-
TIL
-
Spreadsheet Risk Management
-
TIL
-
The Corrupted Blood Incident
-
TIL
-
Orcs of the Office
-
BLOG
-
Agree not to Disagree
-
BLOG
-
Open Sanctions
-
TIL
-
Angry AI Birds
-
TIL
-
Typo/Spelling Error Dataset
-
TIL
-
Playtesting Candycrush
-
TIL
-
Bot Bowl
-
TIL
-
Missing Pedestrians
-
TIL
-
Ascent
-
TIL
-
Game Time Distribution
-
TIL
-
Minecraft Diffusion
-
TIL
-
Only 7 Percent
-
TIL
-
Zelda Street View
-
TIL
-
Data Duplications
-
TIL
-
Annotation Datasets
-
TIL
-
Punderstanding
-
TIL
-
DALC
-
TIL
-
Being a Research Advocate.
-
BLOG
-
Generating Receipts
-
TIL
-
Annotators vs. Tasks
-
TIL
-
Won't Predict via Disagreement
-
TIL
-
Interactive Confusion Matrices
-
TIL
-
Active Churning
-
TIL
-
Active Street Signs
-
TIL
-
Perfect Fit
-
TIL
-
Active, but Visual, Learning
-
TIL
-
The Story Theory
-
TIL
-
Enjoy the Silence
-
BLOG
-
Vulnerable Contributions at Scale
-
TIL
-
VADER
-
TIL
-
Linkrot
-
TIL
-
Learning to Place
-
TIL
-
Beyond Broken
-
BLOG
-
Optimal Seeds
-
TIL
-
1.4 Million Jupyter Notebooks
-
TIL
-
Sentiment and Bias
-
TIL
-
Gorilla Hypotheses
-
TIL
-
Scots Wikipedia
-
TIL
-
Bad Labels
-
BLOG
-
Analytics Providers
-
TIL
-
poke2vec
-
TIL
-
Pandas Format
-
TIL
-
Stopwords
-
TIL
-
Dixit Data
-
TIL
-
Label Errors
-
TIL
-
DnD Data
-
TIL
-
Shaded Screenshots
-
TIL
-
Copilot & Pytest
-
TIL
-
metatags.io
-
TIL
-
Copilot & Submodules
-
TIL
-
Github Actions as a Number
-
TIL
-
Plenty of Bad Labels
-
TIL
-
Recursive HTML
-
TIL
-
Urban Dictionary Embeddings
-
TIL
-
Tesla vs. Stoplights
-
TIL
-
Kolektor
-
TIL
-
Flight Simulatoops
-
TIL
-
Naive Bias[tm] and Fairness Tooling
-
BLOG
-
A Loop to Stop Writing.
-
BLOG
-
Oops and Optimality
-
BLOG
-
Uncommon Contributions
-
BLOG
-
Mean Squared Terror
-
BLOG
-
Sharing is Caring
-
BLOG
-
Introduction to Inference
-
BLOG
-
Theoretical Dependence
-
BLOG
-
Roman Reasoning
-
BLOG
-
What Overfitting Looks Like
-
BLOG
-
Parallel Grid
-
BLOG
-
Goodhart, Bad Metric
-
BLOG
-
High on Probability, Low on Confidence
-
BLOG
-
The Future of Data Science is Past
-
BLOG
-
Gaussian Auto Embeddings
-
BLOG
-
Feed Forward Posteriors
-
BLOG
-
Vary Very Optimally
-
BLOG
-
Switching to Sampling in Order to Switch
-
BLOG
-
Bayesian/Streaming Algorithms
-
BLOG
-
Hello DeepQ
-
BLOG
-
Avoiding, and Preventing, Joins
-
BLOG
-
Variable Selection in Machine Learning
-
BLOG
-
Digital Nomad
-
BLOG
-
Vanity Metrics
-
BLOG