package ml; import java.io.PrintStream; import java.util.ArrayList; import java.util.Collections; import java.util.Random; import java.util.concurrent.ArrayBlockingQueue; import java.util.concurrent.locks.ReentrantReadWriteLock; import shared.Tools; import structures.FloatList; public class TrainerThread extends Thread { public TrainerThread(Trainer parent_, CellNet net0_) { parent=parent_; net0=net0_; net00=net0.copy(false); randyAnneal=new Random(net00.seed); jobsPerEpoch=parent.jobsPerEpoch; orderedJobs=parent.orderedJobs; launchInThread=parent.launchInThread; jobResultsQueue=new ArrayBlockingQueue(jobsPerEpoch); workerQueue=parent.workerQueue; launchQueue=(launchInThread ? new ArrayBlockingQueue(2) : null); training=parent.training; maxEpochs=parent.maxEpochs; targetError=parent.targetError; targetFPR=parent.targetFPR; targetFNR=parent.targetFNR; crossoverFpMult=parent.crossoverFpMult; sortAll=parent.sortAll; sort=parent.sort; sortInThread=parent.sortInThread; shuffleSubset=parent.shuffleSubset; allowMTSort=parent.allowMTSort; alphaZero=parent.alphaZero; alphaMult=parent.alphaMult; alphaMult2=parent.alphaMult2; peakAlphaEpoch=parent.peakAlphaEpoch; alphaIncrease=parent.alphaIncrease; alphaEpochs=parent.alphaEpochs; alphaDropoff=parent.alphaDropoff; annealStrength0=parent.annealStrength0; annealProb=parent.annealProb; annealMult2=parent.annealMult2; annealDropoff0=parent.annealDropoff0; minAnnealEpoch=parent.minAnnealEpoch; maxAnnealEpoch=parent.maxAnnealEpoch; fractionPerEpoch0=parent.fractionPerEpoch0; fractionPerEpoch2=parent.fractionPerEpoch2; fpeStart=parent.fpeStart; positiveTriage=parent.positiveTriage; negativeTriage=parent.negativeTriage; startTriage=parent.startTriage; printStatus=parent.printStatus; printInterval=parent.printInterval; dumpRate=parent.dumpRate; dumpEpoch=parent.dumpEpoch; minWeightEpoch=parent.minWeightEpoch; minWeightEpochInverse=1f/minWeightEpoch; subnets=new CellNet[jobsPerEpoch]; for(int i=0; itargetError)) { mprof.reset(); currentEpoch++; if(currentEpoch==dumpEpoch && dumpRate>0) { dump(data); } if(training) { assert(jobResultsQueue.size()==0); assert(parent.networksPerCycle>1 || workerQueue.size()==0); runTrainingInterval(); assert(jobResultsQueue.size()==0); assert(parent.networksPerCycle>1 || workerQueue.size()==0); } final boolean print=handlePrintInterval(); validateThisEpoch=print; //TODO: can make this more frequent, esp. when not printing boolean validated=false; if(validateThisEpoch | print){ assert(jobResultsQueue.size()==0); assert(parent.networksPerCycle>1 || workerQueue.size()==0); runTestingInterval(validateSet.samples); validated=true; assert(jobResultsQueue.size()==0); assert(parent.networksPerCycle>1 || workerQueue.size()==0); // assert(false) : validateSet.samples.length; } if(validated) { calcNetStats(!training || Trainer.setCutoffForEvaluation); parent.compareWithBest(net0.copy(false)); } mprof.log();//11: 11078/10597 //System.err.println("M finished epoch "+currentEpoch); } return currentEpoch; } @Deprecated private void dump_old(SampleSet data){ // System.err.println("Before: samples="+data.samples.length); // System.err.println("Before: subsets="+parent.subsets); // System.err.println("Before: fpeMult="+fpeMult); // System.err.println("Before: subslen="+data.currentSubset(currentEpoch).samples.length); // System.err.println("Before: fpe= "+calcFractionPerEpoch()); // System.err.println("Before: active ="+(int)(data.currentSubset(currentEpoch).samples.length*calcFractionPerEpoch())); final float retainFraction=(1-dumpRate);//Fraction completely retained final float retainFraction2=(parent.partialDumpFraction<1 ? 1-parent.partialDumpFraction*dumpRate : retainFraction);//Total fraction retained, including the partials runTestingInterval(data.samples); ArrayList plist=new ArrayList(); ArrayList nlist=new ArrayList(); // System.err.println("len="+data.samples.length+", ret="+retainFraction+", +ret2="+retainFraction2); for(Sample s : data.samples) { s.setPivot();//Necessary because the assertion failed once. Usually works, though. assert(s.checkPivot()) : s.pivot+", "+s.calcPivot(); //TODO: Slow if(s.positive) {plist.add(s);} else {nlist.add(s);} } // System.err.println(plist.get(0).pivot+", "+plist.get(0).id); // System.err.println(nlist.get(0).pivot+", "+nlist.get(0).id); Collections.sort(plist); Collections.sort(nlist); // System.err.println(plist.get(0).pivot+", "+plist.get(0).id); // System.err.println(nlist.get(0).pivot+", "+nlist.get(0).id); final int pcount=(int)Math.ceil(plist.size()*retainFraction); final int ncount=(int)Math.ceil(nlist.size()*retainFraction); ArrayList list=new ArrayList(parent.partialDumpFraction<1 ? data.samples.length : pcount+ncount); for(int i=0; i list=new ArrayList(parent.partialDumpFraction<1 ? data.samples.length : pcount+ncount); // System.err.println("samples="+data.samples.length+ // ", pcount="+pcount+"/"+plist.size()+", ncount="+ncount+"/"+nlist.size()); dumpList(plist, list, pcount); dumpList(nlist, list, ncount); // System.err.println("len="+list.size()); assert(data.samples.length>=list.size()); // System.err.println(data.samples.length+", "+list.size()+", "+pcount+", "+ncount); final float sampleRatio=data.samples.length/(float)Tools.max(1, list.size()); Collections.shuffle(list, new Random(SampleSet.shuffleSeed+1)); data.samples=list.toArray(new Sample[0]); // System.err.println("samples="+data.samples.length); data.samplesSortedByResult=data.samples.clone(); data.numPositive=pcount; data.numNegative=ncount; int subsets; boolean shrinkSubsets=parent.shrinkSubsets; //Note: shrinkSubsets is hard-coded as TRUE because it works better if(!shrinkSubsets){//This method of reducing subsets did not improve speed much. final int setsize=parent.setsize; subsets=(int)Math.ceil(parent.subsets*retainFraction2); if(setsize>0) { assert(setsize>=100) : "Setsize should be at least 100"; subsets=Tools.max(1, data.samples.length/setsize); // System.err.println("Data was organized into "+subsets+(subsets==1 ? " set." : " sets.")); } subsets=Tools.mid(1, subsets, data.samples.length); fpeMult=1.0f; }else{//This method makes subsets smaller for less sorting, but also does not improve speed much (~10%). Messes up convergence though. subsets=parent.subsets; fpeMult=sampleRatio;//1f/retainFraction2; assert(fpeMult>=1) : fpeMult; // System.err.println(fpeMult); // System.err.println(1f/retainFraction2); } data.makeSubsets(subsets); // System.err.println("retainFraction2="+retainFraction2); // System.err.println("After: samples="+data.samples.length); // System.err.println("After: subsets="+subsets); // System.err.println("After: fpeMult="+fpeMult); // System.err.println("After: subslen="+data.currentSubset(currentEpoch).samples.length); // System.err.println("After: fpe= "+calcFractionPerEpoch()); // System.err.println("After: active ="+(int)(data.currentSubset(currentEpoch).samples.length*calcFractionPerEpoch())); } private void dumpList(ArrayList inList, ArrayList outList, int retainCount) { Collections.sort(inList); for(int i=0; i=1){ outList.add(inList.get(i)); x-=1; } } } } private void runTrainingInterval() { // synchronized(LOCK) { assert(training); clearStats(); net0.clear(); mprof.log();//0: 614 / 564 selectTrainingSubset(); mprof.log();//1: 197101 / 9032 assert(samplesThisEpoch>0) : samplesThisEpoch+", "+currentSamples.length; assert(jobResultsQueue.size()==0); assert(parent.networksPerCycle>1 || workerQueue.size()==0); final float weightMult=weightMult(); int jobs=launchJobs(net0, currentSamples, samplesThisEpoch, training, weightMult, sort); //Takes longer with sortInThread (or higher fpe) because more samples are sent mprof.log();//2: 90239 / 140357 // } gatherResults(net0, jobResultsQueue, training, jobs); lock(); mprof.log();//3: 561312/661228 //System.err.println("M done waiting for threads."); synchronized(net0) { //System.err.println("M checking epochs."); assert(jobResultsQueue.size()==0); assert(parent.networksPerCycle>1 || workerQueue.size()==0); //System.err.println("M gathering."); mergeStats(samplesThisEpoch); // errorRate=weightedErrorRate; mprof.log();//4: 154/143 net0.applyChanges(samplesThisEpoch, (float)alpha); mprof.log();//5: 2356/2134 anneal(); mprof.log();//6: 2635/2623 adjustAlpha(); triage(); mprof.log();//7: 4998/5798 } } private final float weightMult() { if(currentEpoch>=minWeightEpoch){return 1.0f;} return currentEpoch*minWeightEpochInverse; } private void runTestingInterval(Sample[] set) { final int vlines=Tools.min(parent.maxLinesV, set.length); // synchronized(LOCK) { clearStats(); net0.clear(); int jobs=launchJobs(net0, set, vlines, false, 1f, false); mprof.log();//8: 1738/1709 // } gatherResults(null, jobResultsQueue, false, jobs); lock(); //System.err.println("M done waiting for threads."); // synchronized(LOCK) { mprof.log();//9: 23373/23901 //System.err.println("M checking epochs."); assert(jobResultsQueue.size()==0); assert(parent.networksPerCycle>1 || workerQueue.size()==0); //System.err.println("M gathering."); mergeStats(vlines); // errorRate=weightedErrorRate; mprof.log();//10: 0 // } } void lock() { // System.err.println("Lock"); if(setLock!=null) { setLock.readLock().unlock(); setLock.writeLock().lock(); } } void unlock() { // System.err.println("Unlock"); if(setLock!=null) { setLock.writeLock().unlock(); setLock.readLock().lock(); } } /*--------------------------------------------------------------*/ private void anneal() { if(currentEpoch>maxAnnealEpoch) {annealStrength=0;} else if(currentEpoch>=minAnnealEpoch && annealStrength>0 && annealProb>0 && currentEpoch+1randyAnneal.nextFloat()){ net0.anneal((float)annealStrength, randyAnneal); //annealDropoff=annealDropoff*0.999f; } annealStrength=annealStrength*annealDropoff; if(annealDropoff0==annealDropoff && annealStrength*40=startTriage && samplesThisEpoch==currentSamples.length) { currentSubset.triage(currentEpoch, startTriage, positiveTriage, negativeTriage); } } private class LaunchThread extends Thread{ //Called by start() @Override public void run(){ for(JobData job=getJob(); job!=JobData.POISON; job=getJob()) { launchJobsInner(job.immutableNet, job.set, job.maxSamples, job.epoch, job.alpha, job.backprop, job.weightMult, job.sort); } } JobData getJob() { JobData job=null; while(job==null) { try { job=launchQueue.take(); } catch (InterruptedException e) { e.printStackTrace(); } } return job; } } private int launchJobs(CellNet net0, Sample[] set, int numSamples, boolean backprop, float weightMult, boolean sort) { if(launchInThread) { JobData job=new JobData(net0, jobResultsQueue, currentEpoch, numSamples, alpha, backprop, weightMult, sort, true, null, set, setLock, 0, 0); launchQueue.add(job); return jobsPerEpoch; }else { return launchJobsInner(net0, set, numSamples, currentEpoch, alpha, backprop, weightMult, sort); } } //Does not seem faster... private int launchJobsInner(CellNet net0, Sample[] set, int numSamples_, int epoch, double alpha, boolean backprop, float weightMult, boolean sort) { if(setLock!=null) {return launchJobs_SetLock(net0, set, numSamples_, epoch, alpha, backprop, weightMult, sort);} //TODO: Eliminate this method if the above works //Note: This is a little confusing because you may want to send more samples (samplesToSend) //than you actually want processed (numSamples) if sorting is being done per-thread. final int numSamples=Tools.min(numSamples_, set.length); final boolean sortFlag=sort && sortInThread && numSamples list=new ArrayList(listLen); int idx=jid; while(idxsamplesThisEpoch);} } } private void gatherResultsOrdered(final CellNet net0, final ArrayBlockingQueue mq, final boolean accumulate, final int numJobs) { JobResults[] results=new JobResults[numJobs]; //System.err.println("M waiting for threads."); int next=0; for(int i=0; isamplesThisEpoch);} next++; } } } private boolean handlePrintInterval() { boolean print=!training || currentEpoch==maxEpochs; if(/*printStatus && */currentEpoch>=nextPrintEpoch) { print=true; if(currentEpochprintInterval) { nextPrintEpoch=printInterval; } } if(currentEpoch>=nextPrintEpoch) { nextPrintEpoch+=printInterval; } nextPrintEpoch=Tools.min(nextPrintEpoch, maxEpochs); } return print; } float calcFractionPerEpoch() { if(currentEpoch=fractionPerEpoch0) : f+", "+fractionPerEpoch0+", "+currentEpoch+", "+fpeStart; return f; } final int start=Tools.mid(fpeStart, 0, maxEpochs); final int fpeEpochs=maxEpochs-start; final int epochsSinceStart=currentEpoch-start; final float incr=(fractionPerEpoch2-fractionPerEpoch0)/fpeEpochs; float fractionPerEpoch=(fpeEpochs<1 ? fractionPerEpoch0 : Tools.min(1, (fractionPerEpoch0+incr*(epochsSinceStart)))); assert(Tools.mid(fractionPerEpoch2, fractionPerEpoch0, fractionPerEpoch)==fractionPerEpoch) : "start="+start+", current="+currentEpoch+", fpeEpochs="+fpeEpochs+", epochsSinceStart="+ epochsSinceStart+", incr="+incr+",\n fractionPerEpoch0="+fractionPerEpoch0+ ", fractionPerEpoch2="+fractionPerEpoch2+ ",\n fractionPerEpoch="+fractionPerEpoch; fractionPerEpoch*=fpeMult; return fractionPerEpoch; } //TODO: Use calcFractionPerEpoch instead of recalculating int calcSamplesThisEpoch(Subset currentSubset) { final int len=currentSubset.samples.length; if(currentEpoch>=currentSubset.nextFullPassEpoch) {//This should really go outside the function. currentSubset.nextFullPassEpoch=currentEpoch+SampleSet.subsetInterval; return len; } if(currentEpoch=fractionPerEpoch0) : f+", "+fractionPerEpoch0+", "+currentEpoch+", "+fpeStart; return (int)Tools.min(len, Tools.max(4, jobsPerEpoch, len*f)); } final int start=Tools.mid(fpeStart, 0, maxEpochs); final int fpeEpochs=maxEpochs-start; final int epochsSinceStart=currentEpoch-start; final float incr=(fractionPerEpoch2-fractionPerEpoch0)/fpeEpochs; float fractionPerEpoch=(fpeEpochs<1 ? fractionPerEpoch0 : Tools.min(1, (fractionPerEpoch0+incr*(epochsSinceStart)))); assert(Tools.mid(fractionPerEpoch2, fractionPerEpoch0, fractionPerEpoch)==fractionPerEpoch) : "start="+start+", current="+currentEpoch+", fpeEpochs="+fpeEpochs+", epochsSinceStart="+ epochsSinceStart+", incr="+incr+",\n fractionPerEpoch0="+fractionPerEpoch0+ ", fractionPerEpoch2="+fractionPerEpoch2+ ",\n fractionPerEpoch="+fractionPerEpoch; fractionPerEpoch*=fpeMult; final int ste=(int)Tools.min(currentSamples.length, Tools.max(4, jobsPerEpoch, len*fractionPerEpoch)); return ste; } private void selectTrainingSubset() { currentSubset=data.currentSubset(currentEpoch); currentSamples=currentSubset.samples; samplesThisEpoch=calcSamplesThisEpoch(currentSubset); assert(setLock==null || setLock.writeLock().isHeldByCurrentThread()); final int mod8=currentEpoch&7, mod64=currentEpoch&7; if(shuffleSubset && mod8==Trainer.SHUFFLEMOD) { currentSubset.shuffle(); return; }else if(!sort || sortInThread) { return; }else if(mod64==5) { currentSubset.sortSamples(1f, allowMTSort); }else if(sortAll || mod8==5) { // currentSubset.sortSamples(1f, allowMTSort); currentSubset.sortSamples2(1f, samplesThisEpoch, allowMTSort, flist); }else if(mod8==1) { currentSubset.sortSamples2(fractionPerEpoch0*6, samplesThisEpoch, allowMTSort, flist); }else if(mod8==3 || mod8==7){ // currentSubset.sortSamples(fractionPerEpoch0*3, allowMTSort); currentSubset.sortSamples2(fractionPerEpoch0*3, samplesThisEpoch, allowMTSort, flist); } } private void clearStats() { rawErrorSum=0; weightedErrorSum=0; tpSum=tnSum=fpSum=fnSum=0; } private void gatherStats(JobResults job) { rawErrorSum+=job.errorSum; weightedErrorSum+=job.weightedErrorSum; tpSum+=job.tpSum; tnSum+=job.tnSum; fpSum+=job.fpSum; fnSum+=job.fnSum; } private void mergeStats(int samples) { final int outputs=(data!=null ? data.numOutputs() : validateSet.numOutputs()); final double invSamples=1.0/samples; final double invOutputs=1.0/outputs; // final double e1=net0.errorSum*invSamples; // final double we1=net0.weightedErrorSum*invSamples; // assert(false) : "TP="+tpSum+", TN="+tnSum+", FP="+fpSum+", FN="+fnSum+"; sum="+(tpSum+tnSum+fpSum+fnSum); fpRate=fpSum*invSamples*invOutputs; fnRate=fnSum*invSamples*invOutputs; tpRate=tpSum*invSamples*invOutputs; tnRate=tnSum*invSamples*invOutputs; final double e3=rawErrorSum*invSamples; final double we3=weightedErrorSum*invSamples; // assert!Double.isNaN(e3) : invSamples; rawErrorRate=e3;//Tools.max(e1, e3);//, e2); weightedErrorRate=we3;//Tools.max(we1, we3);//, e2); setNetStats(net0); } void calcNetStats(boolean retainOldCutoff) { SampleSet set=validateSet; if(validateThisEpoch){ if(retainOldCutoff) { set.sortByValue(); lastCutoff=net0.cutoff; fpRate=set.calcFPRFromCutoff(lastCutoff); fnRate=set.calcFNRFromCutoff(lastCutoff); }else if(crossoverFpMult>0) { set.sortByValue(); lastCutoff=set.calcCutoffFromCrossover(crossoverFpMult); fpRate=set.calcFPRFromCutoff(lastCutoff); fnRate=set.calcFNRFromCutoff(lastCutoff); }else if(targetFPR>=0) { set.sortByValue(); fpRate=targetFPR; fnRate=set.calcFNRFromFPR(targetFPR); lastCutoff=set.calcCutoffFromFPR(fpRate); fpRate=set.calcFPRFromCutoff(lastCutoff); }else if(targetFNR>=0) { set.sortByValue(); fnRate=targetFNR; fpRate=set.calcFPRFromFNR(targetFNR); lastCutoff=set.calcCutoffFromFNR(fnRate);//TODO: Test this function fnRate=set.calcFNRFromCutoff(lastCutoff); }else{ lastCutoff=Trainer.cutoffForEvaluation; // fpRate=validateSet.calcFPRFromCutoff(lastCutoff); // fnRate=validateSet.calcFNRFromCutoff(lastCutoff); } tpRate=(set.numPositive/(double)set.samples.length)-fnRate; tnRate=(set.numNegative/(double)set.samples.length)-fpRate; }else { //Not sure what to do here if retainOldCutoff=true lastCutoff=Trainer.cutoffForEvaluation; } // assert(false) : crossoverFpMult+", "+lastCutoff+", "+fpRate+", "+fnRate+", "+targetFPR+", "+set.numPositive+", "+set.numNegative; // assert(fnRate<1) : fnRate+", "+targetFNR+", "+targetFPR;//This was added because one time I forgot to include positive samples setNetStats(net0); } private void setNetStats(CellNet net) { net.fpRate=(float) fpRate; net.fnRate=(float) fnRate; net.tpRate=(float) tpRate; net.tnRate=(float) tnRate; net.errorRate=(float) rawErrorRate; net.weightedErrorRate=(float) weightedErrorRate; net.alpha=(float) alpha; net.annealStrength=(float) annealStrength; net.epoch=currentEpoch; if(lastCutoff!=999) {net.setCutoff((float)lastCutoff);} } /*--------------------------------------------------------------*/ public final boolean success(){return !errorState;} /*--------------------------------------------------------------*/ /*---------------- Common Fields ----------------*/ /*--------------------------------------------------------------*/ private final Trainer parent; private final CellNet net0;//Basis network private final CellNet net00;//A copy private final CellNet[] subnets; //Copies for worker threads (if they don't make copies themselves) /*--------------------------------------------------------------*/ private SampleSet data; private SampleSet validateSet; private final FloatList flist; private Subset currentSubset; private Sample[] currentSamples; private final ReentrantReadWriteLock setLock; /*--------------------------------------------------------------*/ // private final long annealSeed; private final int jobsPerEpoch; // private final int jobsPerBatch; //TODO: Change threads to this. private final boolean orderedJobs; //Without ordered, very very slight nondeterminism. private final ArrayBlockingQueue jobResultsQueue; private final ArrayBlockingQueue workerQueue; private final ArrayBlockingQueue launchQueue; final Profiler mprof=new Profiler("M", 13); private final boolean training; /*--------------------------------------------------------------*/ final int maxEpochs; final float targetError; final float targetFPR; final float targetFNR; final float crossoverFpMult; /*--------------------------------------------------------------*/ final boolean sortAll; final boolean sort; final boolean sortInThread; final boolean shuffleSubset; //Only if sortInThread is true final boolean launchInThread; final boolean allowMTSort; /*--------------------------------------------------------------*/ final double alphaZero; final double alphaMult; final double alphaMult2; final int peakAlphaEpoch; final double alphaIncrease; final int alphaEpochs; final double alphaDropoff; final float annealStrength0; final float annealProb; final float annealMult2; final double annealDropoff0; final int minAnnealEpoch; final int maxAnnealEpoch; private final float fractionPerEpoch0; private final float fractionPerEpoch2; // private float fractionPerEpoch; private float fpeMult=1.0f; private final int fpeStart; private final float positiveTriage; private final float negativeTriage; private final int startTriage; private final boolean printStatus; private final int printInterval; private final float dumpRate; private final int dumpEpoch; private final int minWeightEpoch; private final float minWeightEpochInverse; /*--------------------------------------------------------------*/ float bestErrorRate=999; float bestFNR=999; double rawErrorSum=0; double weightedErrorSum=0; long tpSum=0, tnSum=0, fpSum=0, fnSum=0; double rawErrorRate=999f; double weightedErrorRate=999f; double fpRate=0, fnRate=0, tpRate, tnRate; double lastCutoff=999f; double annealStrength; double annealDropoff; double alpha; /*--------------------------------------------------------------*/ private int nextPrintEpoch=1; private int samplesThisEpoch=-1; private boolean validateThisEpoch=false; private int currentEpoch=0; /*--------------------------------------------------------------*/ /*---------------- Final Fields ----------------*/ /*--------------------------------------------------------------*/ final Random randyAnneal; // private static final Sample[] poisonSamples=new Sample[0]; /*--------------------------------------------------------------*/ /*---------------- Common Fields ----------------*/ /*--------------------------------------------------------------*/ /** Print status messages to this output stream */ private PrintStream outstream=System.err; /** Print verbose messages */ public static boolean verbose=false; /** True if an error was encountered */ public boolean errorState=false; }