Text this: Gradiente estocástico y aproximación estocástica aplicados a Q-learning