• Nenhum resultado encontrado

Considerações Finais

6.1 TRABALHOS FUTUROS

2013) atestaram sua superioridade em diversos problemas de rastreamento em relação a outras técnicas do estado da arte.

Em contrapartida, o TLD perde parte de seu desempenho quando a cena na qual o objeto está sendo rastreado possui mais objetos parecidos com o alvo. Isso acontece porque uma parte importante do módulo de detecção, o classificador comitê, possui uma limitação na aprendi- zagem que depende da sua inicialização. Essa limitação pode impedir que o aprendizado seja feito dentre objetos que tem características semelhantes e por isso precisam ser avaliados de forma mais profunda.

Visando solucionar tal problema, a pesquisa elaborada neste trabalho resultou na criação da técnica Online Cascade Boosted Classifier. O classificador elaborado possui uma estrutura do tipo cascata, que permite que a sua complexidade aumente de acordo com a complexidade do problema. Quando objetos semelhantes estão presentes na cena, um número maior de estágios na cascata são criados e assim os objetos são discriminados com sucesso. Esse classificador foi incluído no módulo de detecção do TLD, no lugar do comitê, gerando o rastreador OCBC- TLD-v1.

No entanto, através de experimentação empírica, pode-se observar que as respostas dos classificadores OCBC e comitê se complementam. O complemento positivo obtido pela junção pode ser explicado pelo fato de que cada classificador possui uma taxa de aprendizado dife- rente. O comitê tende a aprender rapidamente um novo patch apresentado, mas também pode o esquecer rápido caso padrões negativos com características semelhantes sejam apresentados. Já o OCBC tem um aprendizado mais lento, por ter que formar a cascata de classificadores, e tende a esquecer mais lentamente padrões antigos.

A junção destes dois classificadores resultou na criação do rastreador OCBC-TLD-v2. Este método uniu o OCBC e o comitê em um único módulo de detecção. Vários experimentos foram feitos utilizando bases desafiadoras na área de rastreamento facial e os resultados obtidos com- provaram que de fato houve uma melhora significativa na taxa de rastreamento. Este avanço foi ainda mais evidente na base SPEVI, uma base que possui várias faces (objetos semelhantes) que movimentam, sobrepondo-se e saindo de cena.

Além dos testes feitos para comprovar o sucesso no rastreamento, outros testes foram feitos para avaliar o alinhamento do retângulo estimado e para medir o tempo de execução. Em re- lação ao alinhamento, o OCBC-TLD-v2 não teve o melhor resultado, mas seu desempenho foi bem próximo do melhor. Em relação ao tempo de execução, nenhuma das técnicas avaliadas podem executar em tempo real sem que haja perda de quadros. No entanto, para vários conjun- tos de problemas essa perda pode ser considerada aceitável e não prejudicar no desempenho do rastreador.

6.1

Trabalhos Futuros

Apesar do sucesso conseguido com a técnica OCBC-TLD-v2, ainda há espaço para evoluções. Um importante passo é modificar o OCBC-TLD-v2 para lidar com múltiplos objetos da mesma categoria (como faces ou pedetres) ao mesmo tempo. Se vários rastreamentos são feitos ao mesmo tempo na cena, pode-se evitar facilmente que ocorram falsos positivos (quando objeto rastreado sai de cena e é re-inicializado em outro objeto). Isso provavelmente aumentará a taxa de sucesso de rastreamento em um cenário com múltiplos objetos semelhantes.

6.1 TRABALHOS FUTUROS 88

Outra melhoria que pode ser feita é criar um algoritmo para o controle da aprendizagem. Os testes executados mostraram que em algumas situações um alto número de padrões aprendidos aconteciam no último módulo de detecção, o que fazia com que mais memória e tempo fossem consumidos. Talvez empregar alguma técnica de esquecimento de padrões antigos ou algum método de seleção de protótipos possa ajudar a diminuir o consumo de recursos.

Por último, é importante testar a técnica em outras áreas do rastreamento além de apenas o rastreamento de faces, como pedestres, carros, e outros sub-problemas que poderiam se benefi- ciar da utilização do OCBC-TLD-v2. Isto não só comprovaria que o método pode ser utilizado independente do problema como também mostraria pontos em que o algoritmo pode melhorar quando outras categorias são apresentadas ao rastreador.

89

C

APÍTULO

7

Referências

AVIDAN, S. Support vector tracking. Pattern Analysis and Machine Intelligence, IEEE Transactions on, [S.l.], v.26, n.8, p.1064–1072, Aug 2004.

BABENKO, B.; YANG, M.-H.; BELONGIE, S. Robust object tracking with online multiple instance learning. Pattern Analysis and Machine Intelligence, IEEE Transactions on, [S.l.], v.33, n.8, p.1619–1632, 2011.

BELAROUSSI, R.; MILGRAM, M. A comparative study on face detection and tracking algo- rithms. Expert Systems with Applications, [S.l.], v.39, n.8, p.7158 – 7164, 2012.

BIBBY, C.; REID, I. Real-time tracking of multiple occluding objects using level sets. 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, [S.l.], p.1307–1314, June 2010.

BINH, N. D. Online Multiple Tasks One-shot Learning of Object Categories and Vision. In: INTERNATIONAL CONFERENCE ON ADVANCES IN MOBILE COMPUTING AND MULTIMEDIA, 9., New York, NY, USA. Proceedings. . . ACM, 2011. p.131–138. (MoMM ’11).

BLACK, M. J.; JEPSON, A. D. EigenTracking: robust matching and tracking of articulated ob- jects using a view-based representation. International Journal of Computer Vision, [S.l.], v.26, n.1, p.63–84, 1998.

BOUGUET, J.-Y. Pyramidal implementation of the Lucas Kanade feature tracker. Intel Cor- poration, Microprocessor Research Labs, [S.l.], 2000.

BRADSKI, G. The OpenCV Library. Dr. Dobb’s Journal of Software Tools, [S.l.], 2000.

CHEN, C.-N. Accelerated modified Newton-Raphson iteration-based finite-element solution of structural problems involving non-linear deformation behaviour. Communications in Nu- merical Methods in Engineering, [S.l.], v.10, n.4, p.333–338, 1994.

CHEN, K. et al. Enhanced strong Kalman filter applied in precise video tracking for fast mobile target. In: PROGRESS IN INFORMATICS AND COMPUTING (PIC), 2010 IEEE INTER- NATIONAL CONFERENCE ON. Anais. . . [S.l.: s.n.], 2010. v.2, p.875–878.

CHEN, Z. et al. Video Object Tracking Based on a Chamfer Distance Transform. In: IMAGE PROCESSING, 2007. ICIP 2007. IEEE INTERNATIONAL CONFERENCE ON. Anais. . . [S.l.: s.n.], 2007. v.3, p.III – 357–III – 360.

CAPÍTULO 7 REFERÊNCIAS 90

CHENG, Y. Mean shift, mode seeking, and clustering. Pattern Analysis and Machine Intel- ligence, IEEE Transactions on, [S.l.], v.17, n.8, p.790–799, 1995.

COMANICIU, D.; RAMESH, V.; MEER, P. Kernel-based object tracking. Pattern Analysis and Machine Intelligence, IEEE Transactions on, [S.l.], v.25, n.5, p.564–577, 2003.

DALAL, N.; TRIGGS, B. Histograms of oriented gradients for human detection. In: COMPU- TER VISION AND PATTERN RECOGNITION, 2005. CVPR 2005. IEEE COMPUTER SOCIETY CONFERENCE ON. Anais. . . [S.l.: s.n.], 2005. v.1, p.886–893 vol. 1.

DORE, A.; BEOLDO, A.; REGAZZONI, C. Multitarget tracking with a corner-based particle filter. In: COMPUTER VISION WORKSHOPS (ICCV WORKSHOPS), 2009 IEEE 12TH INTERNATIONAL CONFERENCE ON. Anais. . . [S.l.: s.n.], 2009. p.1251–1258.

FREUND, Y.; SCHAPIRE, R. E. A decision-theoretic generalization of on-line learning and an application to boosting. In: SECOND EUROPEAN CONFERENCE ON COMPUTATI- ONAL LEARNING THEORY, London, UK, UK. Proceedings. . . Springer-Verlag, 1995. p.23–37. (EuroCOLT ’95).

FROBA, B.; KUBLBECK, C. Face Tracking by Means of Continuous Detection. In: COMPU- TER VISION AND PATTERN RECOGNITION WORKSHOP, 2004. CVPRW ’04. CON- FERENCE ON. Anais. . . [S.l.: s.n.], 2004. p.65–65.

GRABNER, H.; BISCHOF, H. On-line boosting and vision. In: COMPUTER VISION AND PATTERN RECOGNITION, 2006 IEEE COMPUTER SOCIETY CONFERENCE ON. Anais. . . IEEE, 2006. v.1, p.260–267.

GRABNER, H.; LEISTNER, C.; BISCHOF, H. Semi-Supervised On-line Boosting for Robust Tracking. ECCV, [S.l.], n.813399, 2008.

HARRIS, C.; STEPHENS, M. A Combined Corner and Edge Detector. In: ALVEY VISION CONFERENCE, 4. Proceedings. . . [S.l.: s.n.], 1988. p.147–151.

ISARD, M. CONDENSATION Conditional Density Propagation for Visual Tracking. Inter- national journal of computer vision, [S.l.], v.29, n.1, p.5–28, 1998.

JUNG, C.; SAID, A. Object tracking using multiple fragments. In: IMAGE PROCESSING (ICIP), 2009 16TH IEEE INTERNATIONAL CONFERENCE ON. Anais. . . IEEE, 2009. p.889–892.

KALAL, Z.; MATAS, J.; MIKOLAJCZYK, K. Weighted Sampling for Large-Scale Boosting. In: BMVC. Anais. . . [S.l.: s.n.], 2008.

KALAL, Z.; MATAS, J.; MIKOLAJCZYK, K. Online learning of robust object detectors du- ring unstable tracking. In: COMPUTER VISION WORKSHOPS (ICCV WORKSHOPS), 2009 IEEE 12TH INTERNATIONAL CONFERENCE ON. Anais. . . Ieee, 2009. p.1417– 1424.

CAPÍTULO 7 REFERÊNCIAS 91

KALAL, Z.; MIKOLAJCZYK, K.; MATAS, J. Forward-Backward Error: automatic detection of tracking failures. In: PATTERN RECOGNITION (ICPR), 2010 20TH INTERNATIO- NAL CONFERENCE ON. Anais. . . [S.l.: s.n.], 2010. p.2756–2759.

KALAL, Z.; MIKOLAJCZYK, K.; MATAS, J. Face-TLD: tracking-learning-detection applied to faces. In: IMAGE PROCESSING (ICIP), 2010 17TH IEEE INTERNATIONAL CONFE- RENCE ON. Anais. . . IEEE, 2010. n.i, p.3789–3792.

KALAL, Z.; MIKOLAJCZYK, K.; MATAS, J. Tracking-Learning-Detection. IEEE transac- tions on pattern analysis and machine intelligence, [S.l.], v.6, n.1, p.1–14, 2011.

KALAL, Z.; MIKOLAJCZYK, K.; MATAS, J. Tracking-Learning-Detection. Pattern Analy- sis and Machine Intelligence, IEEE Transactions on, [S.l.], v.34, n.7, p.1409–1422, 2012.

KALMAN, R. A new approach to linear filtering and prediction problems. Journal of basic Engineering, [S.l.], v.82, n.Series D, p.35–45, 1960.

KHAN, S. M.; SHAH, M. Tracking multiple occluding people by localizing on multiple scene planes. IEEE transactions on pattern analysis and machine intelligence, [S.l.], v.31, n.3, p.505–19, Mar. 2009.

LI, C.; GUO, L.; HU, Y. A new method combining HOG and Kalman filter for video-based human detection and tracking. In: IMAGE AND SIGNAL PROCESSING (CISP), 2010 3RD INTERNATIONAL CONGRESS ON. Anais. . . [S.l.: s.n.], 2010. v.1, p.290–293.

LI, Z.; CHEN, J.; SCHRAUDOLPH, N. An improved mean-shift tracker with kernel predic- tion and scale optimisation targeting for low-frame-rate video tracking. In: PATTERN RE- COGNITION, 2008. ICPR 2008. 19TH INTERNATIONAL CONFERENCE ON. Anais. . . [S.l.: s.n.], 2008. p.1–4.

LUKAS, B. An iterative image registration technique with an application to stereo vision. Image Understanding Workshop, [S.l.], n.x, p.674–679, 1981.

MAGGIO, E.; CAVALLARO, A. Video Tracking: theory and practice. [S.l.]: Wiley, 2011.

MAGGIO, E. et al. Particle PHD Filtering for Multi-Target Visual Tracking. In: ACOUSTICS, SPEECH AND SIGNAL PROCESSING, 2007. ICASSP 2007. IEEE INTERNATIONAL CONFERENCE ON. Anais. . . [S.l.: s.n.], 2007. v.1, p.I–1101–I–1104.

MAINALI, P. et al. Robust low complexity feature tracking. In: IMAGE PROCESSING (ICIP), 2010 17TH IEEE INTERNATIONAL CONFERENCE ON. Anais. . . [S.l.: s.n.], 2010. p.829–832.

MONTGOMERY, D. C.; RUNGER, G. C. Applied Statistics and Probability for Engineers. 4.ed. [S.l.]: John Wiley & Sons, 2006.

CAPÍTULO 7 REFERÊNCIAS 92

MORENO-NOGUER, F.; SANFELIU, A.; SAMARAS, D. Dependent Multiple Cue Integra- tion for Robust Tracking. Pattern Analysis and Machine Intelligence, IEEE Transactions on, [S.l.], v.30, n.4, p.670–685, 2008.

NGUYEN, H. V.; BANERJEE, A.; CHELLAPPA, R. Tracking via object reflectance using a hyperspectral video camera. In: COMPUTER VISION AND PATTERN RECOGNI- TION WORKSHOPS (CVPRW), 2010 IEEE COMPUTER SOCIETY CONFERENCE ON. Anais. . . [S.l.: s.n.], 2010. p.44–51.

OJALA, T.; PIETIKAINEN, M.; MAENPAA, T. Multiresolution gray-scale and rotation inva- riant texture classification with local binary patterns. Pattern Analysis and Machine Intel- ligence, IEEE Transactions on, [S.l.], v.24, n.7, p.971–987, 2002.

PARK, S.-W.; PARK, J.-Y.; JEON, B.-M. Efficient motion compensation using multiple warped reference pictures based on feature tracking and segmentation. In: IMAGE PROCESSING (ICIP), 2009 16TH IEEE INTERNATIONAL CONFERENCE ON. Anais. . . [S.l.: s.n.], 2009. p.1601–1604.

ROSS, D. et al. Incremental Learning for Robust Visual Tracking. International Journal of Computer Vision, [S.l.], v.77, n.1-3, p.125–141, 2008.

SCHMIDT, S. Applications of state-space methods to navigation problems. Advances in Con- trol Systems, [S.l.], v.3, p.293–340, 1966.

SHI, J.; TOMASI, C. Good features to track. In: COMPUTER VISION AND PATTERN RECOGNITION, 1994. PROCEEDINGS CVPR ’94., 1994 IEEE COMPUTER SOCIETY CONFERENCE ON. Anais. . . [S.l.: s.n.], 1994. p.593–600.

STALDER, S.; GRABNER, H. Beyond semi-supervised tracking: tracking should be as simple as detection, but not simpler than recognition. Vision Workshops (ICCV, [S.l.], 2009.

SUNG, K.-K.; POGGIO, T. Example-based learning for view-based human face detection. Pattern Analysis and Machine Intelligence, IEEE Transactions on, [S.l.], v.20, n.1, p.39– 51, 1998.

TAHERI, S.; SANKARANARAYANAN, A.; CHELLAPPA, R. Joint Albedo Estimation and Pose Tracking from Video. Pattern Analysis and Machine Intelligence, IEEE Transacti- ons on, [S.l.], v.35, n.7, p.1674–1689, 2013.

TIEU, K.; VIOLA, P. Boosting image retrieval. In: COMPUTER VISION AND PATTERN RECOGNITION, 2000. PROCEEDINGS. IEEE CONFERENCE ON. Anais. . . [S.l.: s.n.], 2000. v.1, p.228–235 vol.1.

VIGUS, S.; BULL, D.; CANAGARAJAH, C. Video object tracking using region split and merge and a Kalman filter tracking algorithm. In: IMAGE PROCESSING, 2001. PROCE- EDINGS. 2001 INTERNATIONAL CONFERENCE ON. Anais. . . [S.l.: s.n.], 2001. v.1, p.650–653 vol.1.

CAPÍTULO 7 REFERÊNCIAS 93

VIOLA, P.; JONES, M. Rapid object detection using a boosted cascade of simple features. Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. CVPR 2001, [S.l.], v.1, p.I–511–I–518, 2001.

VIOLA, P.; JONES, M. Robust real-time object detection. International journal of computer vision, [S.l.], 2001.

VIOLA, P.; PLATT, J. C.; ZHANG, C. Multiple instance boosting for object detection. In: NIPS 18. Anais. . . MIT Press, 2006. p.1419–1426.

WU, Y.; LIM, J.; YANG, M.-H. Online Object Tracking: a benchmark. In: COMPU- TER VISION AND PATTERN RECOGNITION (CVPR), 2013 IEEE CONFERENCE ON. Anais. . . [S.l.: s.n.], 2013. p.2411–2418.

YILMAZ, A.; JAVED, O.; SHAH, M. Object tracking: a survey. ACM Computing Surveys, [S.l.], v.38, n.4, p.13–es, Dec. 2006.

Documentos relacionados