4.3 Transi¸c˜ oes graduais
5.1.3 Separa¸c˜ ao de tomadas: o limiar k ψ corte
O parˆametro kcorteψ , como visto anteriormente no Cap´ıtulo 4, estabelece um limiar para a distˆancia relativa entre o m´aximo local e os demais valores na janela. Quanto maior o valor dekψcorte, mais destacado deve ser z1(i) para que qi delimite uma tomada.
As Tabelas 5.6 e5.7 mostram como o valor de kψcorte afeta os resultados obtidos pelo
Algo-5.1. AN ´ALISE DE PAR ˆAMETROS 67 V´ıdeo kcorteψ Rcorte Pcorte Rgrad Pgrad
CNN 03/02 1998 30 0.7893 0.6190 0.8304 0.6228 40 0.7678 0.7544 0.8304 0.6604 50 0.7357 0.8803 0.8070 0.6667 60 0.6821 0.9409 0.8011 0.7061 70 0.5750 0.9415 0.7602 0.7143 80 0.4321 0.9453 0.6608 0.7290 CNN 22/02/1998 30 0.8867 0.5362 0.6337 0.3636 40 0.8770 0.7324 0.6535 0.4049 50 0.8511 0.9100 0.6436 0.4710 60 0.8285 0.9624 0.6238 0.5122 70 0.7508 0.9667 0.5742 0.5631 80 0.5534 0.9827 0.4950 0.6493 CNN 15/05/1998 30 0.8869 0.6354 0.7328 0.5189 40 0.8728 0.7553 0.7328 0.5454 50 0.8516 0.8486 0.7099 0.5886 60 0.7880 0.9330 0.6870 0.6475 70 0.6714 0.9743 0.6107 0.6452 80 0.4700 0.9708 0.4656 0.6630
Tabela 5.6: Resultados obtidos pelo Algoritmo 4 sobre z∩1(i) com kgrad = 0.04, m = 11 e 64 bins para v´arios valores de kψcorte.
ritmo 4 sobre z∩1(i) e z1◦(i) respectivamente. Estes resultados mostram que valores acima de 50% degeneram o reconhecimento, sobretudo o de cortes.
5.1.4 Transi¸ c˜ oes graduais e o limiar k
gradO Algoritmo 2 difere pouco do twin-comparison original na detec¸c˜ao de transi¸c˜oes graduais.
Um limiar kgrad busca identificar poss´ıveis seq¨uˆencias de quadros candidatos e, por fim, a diferen¸ca acumulada entre os quadros inicial e final de cada seq¨uˆencia ´e analisada de forma similar `a detec¸c˜ao de cortes.
Valores baixos de kgrad, al´em de gerarem falsos positivos, aumentam o tempo total de
68 CAP´ITULO 5. RESULTADOS EXPERIMENTAIS
V´ıdeo kcorteψ Rcorte Pcorte Rgrad Pgrad
CNN 03/02 1998 30 0.7786 0.2781 0.4795 0.7130 40 0.7643 0.3919 0.4971 0.7203 50 0.7571 0.4988 0.5146 0.7586 60 0.7321 0.6137 0.5205 0.7672 70 0.7000 0.7567 0.5029 0.7478 80 0.6536 0.8512 0.4737 0.8020 CNN 22/02/1998 30 0.8835 0.2103 0.3861 0.5821 40 0.8641 0.3034 0.3960 0.5714 50 0.8511 0.4361 0.3861 0.5735 60 0.8284 0.5447 0.3762 0.5672 70 0.8123 0.6711 0.3762 0.5846 80 0.7767 0.8191 0.3564 0.6207 CNN 15/05/1998 30 0.8939 0.2694 0.4580 0.8108 40 0.8728 0.3847 0.4809 0.7590 50 0.8551 0.5020 0.4733 0.7294 60 0.8162 0.6193 0.4962 0.7222 70 0.7668 0.7457 0.4809 0.7159 80 0.6996 0.8684 0.4504 0.7284
Tabela 5.7: Resultados obtidos pelo Algoritmo 4 sobre z◦1(i) com kgrad = 0.04, m = 11 e 64 bins para v´arios valores de kψcorte.
5.2. TESTES 69 V´ıdeo kcorteψ Rgrad Pgrad
CNN 03/02 1998 0.04 0.8070 0.6667 0.05 0.7544 0.6898 0.06 0.6959 0.7484 0.07 0.6257 0.7589 CNN 22/02/1998 0.04 0.6435 0.4710 0.05 0.5742 0.5088 0.06 0.5148 0.5252 0.07 0.4851 0.5764 CNN 15/05/1998 0.04 0.7099 0.5886 0.05 0.6564 0.6056 0.06 0.6183 0.6807 0.07 0.5725 0.7211
Tabela 5.8: Resultados obtidos pelo Algoritmo 4 sobre z∩1(i) com kcorteψ = 50%, m = 11 e 64 bins para v´arios valores de kgrad.
processamento devido a maior ocorrˆencia de candidatos. Inversamente, valores altos podem perder transi¸c˜oes, mas reduzem o tempo de execu¸c˜ao do algoritmo.
As Tabelas5.8 e5.9apresentam os resultados obtidos por v´arios valores dekgrad (com kψcorte fixo em 50%). Movimenta¸c˜ao de cˆameras e objetos,zooms e transi¸c˜oes graduais entre tomadas com distribui¸c˜ao similar de luminosidade s˜ao as principais causas do baixo desempenho apre-sentado.
5.2 Testes
Os oito v´ıdeos foram processados pelo Algoritmo 4 sobre z∩1(i), calculado em histogramas de 64bins, utilizando-se os trˆes melhores valores dekcorteψ ekgrad. O suporte temporal foi dado por m= 11.
Os resultados s˜ao exibidos nas Tabelas 5.10 e 5.11. O desempenho alcan¸cado na detec¸c˜ao
70 CAP´ITULO 5. RESULTADOS EXPERIMENTAIS
V´ıdeo kcorteψ Rgrad Pgrad
CNN 03/02 1998 0.02 0.6667 0.6909 0.03 0.5672 0.7239 0.04 0.5146 0.7586 0.05 0.4561 0.7573 0.06 0.4152 0.7717 0.07 0.3567 0.7721 CNN 22/02/1998 0.02 0.5544 0.4786 0.03 0.4257 0.5308 0.04 0.3861 0.5735 0.05 0.3960 0.625 0.06 0.3861 0.7091 0.07 0.3564 0.6923 CNN 15/05/1998 0.02 0.6183 0.6000 0.03 0.5420 0.6961 0.04 0.4733 0.7294 0.05 0.4275 0.7778 0.06 0.3893 0.7612 0.07 0.3511 0.7419
Tabela 5.9: Resultados obtidos pelo Algoritmo 4 sobre z◦1(i) com kψcorte = 50%, m = 11 e 64 bins para v´arios valores de kgrad.
5.3. APLICAC¸ ˜AO: SUMARIZAC¸ ˜AO DE V´IDEO DIGITAL 71 de cortes ´e pr´oximo de 90% tanto em reconhecimento quanto em precis˜ao. J´a o desempenho obtido na detec¸c˜ao de transi¸c˜oes graduais ´e inferior, girando em torno de 70% para Rgrad e Pgrad. Contudo, este resultado ´e comumente aceit´avel em aplica¸c˜oes de sumariza¸c˜ao de v´ıdeo, como a que veremos a seguir.
5.3 Aplica¸ c˜ ao: sumariza¸ c˜ ao de v´ıdeo digital
A Figura 5.1 mostra uma aplica¸c˜ao simples para a delimita¸c˜ao de tomadas: sumariza¸c˜ao de v´ıdeo para a explora¸c˜ao r´apida de seu conte´udo por parte do usu´ario. O sum´ario, constru´ıdo automaticamente com base nos resultados obtidos pelo Algoritmo 4, pode ser visto em um navegadorWeb comum.
Um quadro-chave ´e apresentado por tomada. A legenda abaixo do quadro informa o n´umero da tomada e seu instante de in´ıcio (minutos e segundos) no v´ıdeo. A medidaz∩(qi, qj)
´
e aplicada entre os quadros-chaves e comparada a um limiar, criando-se assim referˆencias entre tomadas similares. A Figura 5.1 ilustra uma dessas liga¸c˜oes: a tomada 4 referencia a tomada 44 (as duas exibem o ˆancora do ABC World News Tonight).
72 CAP´ITULO 5. RESULTADOS EXPERIMENTAIS V´ıdeo kcorteψ Rcorte Pcorte kgrad Rgrad Pgrad Rcov Pcov
0.04 0.8304 0.6605 0.7052 0.8446 40% 0.7678 0.7544 0.05 0.7719 0.6984 0.7167 0.9029 0.06 0.7017 0.7453 0.6072 0.9270 0.04 0.8070 0.6667 0.7119 0.8612 CNN 03/02/1998 50% 0.7357 0.8803 0.05 0.7544 0.6898 0.7218 0.9037 0.06 0.6959 0.7484 0.6468 0.9274 0.04 0.8012 0.7062 0.7638 0.8727 60% 0.6821 0.9409 0.05 0.7602 0.7558 0.7051 0.9190 0.06 0.6667 0.7917 0.6470 0.9265 0.04 0.6535 0.4049 0.6372 0.8789 40% 0.8770 0.7324 0.05 0.5940 0.4800 0.5960 0.9046 0.06 0.1287 0.5909 0.6990 0.9096 0.04 0.6436 0.4710 0.6677 0.8445 CNN 22/02/1998 50% 0.8511 0.9100 0.05 0.5742 0.5088 0.6073 0.9041 0.06 0.5148 0.5252 0.6000 0.9425 0.04 0.6238 0.5122 0.6515 0.8409 60% 0.8285 0.9624 0.05 0.5544 0.5544 0.6205 0.9165 0.06 0.4752 0.6076 0.6004 0.9474 0.04 0.7328 0.5454 0.7166 0.8184 40% 0.8728 0.7553 0.05 0.6641 0.5918 0.6523 0.8415 0.06 0.6412 0.6885 0.6274 0.9001 0.04 0.7099 0.5886 0.7260 0.8206 CNN 15/05/1998 50% 0.8516 0.8486 0.05 0.6565 0.6056 0.6547 0.8562 0.06 0.6183 0.6807 0.6219 0.8923 0.04 0.6870 0.6475 0.7248 0.8163 60% 0.7880 0.9330 0.05 0.6259 0.6406 0.6469 0.8670
0.06
0.04 0.5833 0.5431 0.6667 0.7705 40% 0.8914 0.7619 0.05 0.5000 0.5400 0.6448 0.8821 0.06 0.4722 0.5795 0.5701 0.9099 0.04 0.6111 0.6055 0.6664 0.7865 CNN 31/05/1998 50% 0.8774 0.8974 0.05 0.5185 0.5714 0.6499 0.8920 0.06 0.4815 0.6046 0.5760 0.9182 0.04 0.6204 0.6569 0.6861 0.7825 60% 0.8468 0.9412 0.05 0.5092 0.6180 0.6584 0.8830 0.06 0.4722 0.6456 0.6088 0.9118 Tabela 5.10: Resultados obtidos pelo Algoritmo 4 sobre z∩1(i) com m = 11 no conjunto de testes oriundo do canal de televis˜ao CNN.
5.3. APLICAC¸ ˜AO: SUMARIZAC¸ ˜AO DE V´IDEO DIGITAL 73 V´ıdeo kψcorte Rcorte Pcorte kgrad Rgrad Pgrad Rcov Pcov
0.04 0.7404 0.6831 0.6322 0.8922 40% 0.8986 0.9268 0.05 0.6488 0.7944 0.5744 0.9174 0.06 0.5725 0.8152 0.5497 0.9516 0.04 0.7328 0.7111 0.6167 0.8942 ABC 24/02/1998 50% 0.8649 0.9481 0.05 0.6564 0.7963 0.5651 0.9201 0.06 0.5649 0.8222 0.5314 0.9576 0.04 0.6870 0.7692 0.6346 0.9170 60% 0.8446 0.9506 0.05 0.5878 0.8555 0.5854 0.9150 0.06 0.5267 0.8625 0.5374 0.9560 0.04 0.7956 0.6687 0.5820 0.9008 40% 0.9043 0.8455 0.05 0.7080 0.7185 0.5765 0.9346 0.06 0.6569 0.8036 0.5760 0.9634 0.04 0.7810 0.7230 0.6160 0.9079 ABC 12/04/1998 50% 0.8898 0.9136 0.05 0.7008 0.7680 0.5996 0.9406 0.06 0.6496 0.8318 0.6067 0.9631 0.04 0.7591 0.8000 0.6436 0.9093 60% 0.8783 0.9619 0.05 0.7153 0.8596 0.6147 0.9402 0.06 0.6350 0.8877 0.6026 0.9613 0.04 0.8278 0.6367 0.7214 0.8110 40% 0.8712 0.7859 0.05 0.7611 0.7287 0.6850 0.8976 0.06 0.7111 0.8050 0.6885 0.9511 0.04 0.8222 0.7014 0.7729 0.8128 ABC 25/04/1998 50% 0.8576 0.9200 0.05 0.7444 0.7836 0.7687 0.8938 0.06 0.7111 0.8366 0.6872 0.9443 0.04 0.7944 0.7566 0.7685 0.8073 60% 0.8135 0.9562 0.05 0.7055 0.8089 0.7519 0.8897 0.06 0.6667 0.8276 0.6824 0.9460 0.04 0.8189 0.6265 0.7162 0.8635 40% 0.9439 0.9352 0.05 0.7401 0.7460 0.6663 0.9001 0.06 0.6535 0.7477 0.6667 0.9384 0.04 0.8110 0.6867 0.7374 0.8875 ABC 19/06/1998 50% 0.9283 0.9613 0.05 0.7244 0.7541 0.6991 0.9182 0.06 0.6535 0.7615 0.6656 0.9582 0.04 0.7795 0.7279 0.7719 0.8880 60% 0.8941 0.9762 0.05 0.7008 0.7807 0.7289 0.9144 0.06 0.6299 0.8000 0.6979 0.9646 Tabela 5.11: Resultados obtidos pelo Algoritmo 4 sobre z∩1(i) com m = 11 no conjunto de testes oriundo do canal de televis˜ao ABC.
74 CAP´ITULO 5. RESULTADOS EXPERIMENTAIS
Figura 5.1: Trecho do sum´ario constru´ıdo automaticamente para ABC 19/06/1998. Re-ferˆencias (web links) ligam tomadas com conte´udo visual similar.
Cap´ıtulo 6 Conclus˜ oes
Neste trabalho, foi apresentado o problema da segmenta¸c˜ao temporal de tomadas e sua im-portˆancia na estrutura¸c˜ao e indexa¸c˜ao de v´ıdeo digital. As principais propostas de solu¸c˜ao encontradas na literatura foram introduzidas e debatidas. Este estudo se concentrou em me-didas de varia¸c˜ao do conte´udo visual entre quadros do v´ıdeo, baseadas em histogramas de cor.
A principal contribui¸c˜ao, nesse sentido, foi uma revis˜ao do cl´assico algoritmotwin-comparison (Algoritmo 2 ) de Zhang et al. [ZKS93], propondo uma nova vers˜ao aqui chamada de twin-comparison ψ (Algoritmo 4). Tal vers˜ao se baseia em m´aximos locais, encontrados no sinal de varia¸c˜ao do conte´udo visual, e sua distˆancia relativa aos demais valores de sua vizinhan¸ca.
Foi discutido, atrav´es de testes com v´arias seq¨uˆencias de v´ıdeo, como os parˆametros utiliza-dos pelo algoritmo (limiares, suporte temporal, granularidade do histograma) impactam seu desempenho. Examinou-se, ainda, duas formas diferentes de compara¸c˜ao de histogramas: in-tersec¸c˜ao entre bins e correla¸c˜ao de histogramas, sendo a primeira medida a que apresentou melhores resultados, como defendido por Gargi et al. [GKS00].
Os resultados apresentados aqui e os encontrados na literatura recente mostram que,
em-75
76 CAP´ITULO 6. CONCLUS ˜OES bora a detec¸c˜ao de cortes possa obter n´ıveis razo´aveis de reconhecimento e precis˜ao para sua aplica¸c˜ao em sistemas de sumariza¸c˜ao de v´ıdeo, a detec¸c˜ao de transi¸c˜oes graduais ainda n˜ao atinge n´ıveis similares de desempenho. Caracter´ısticas de baixo-n´ıvel, isto ´e, com pouca in-forma¸c˜ao semˆantica, tais como distribui¸c˜ao de cor, m´edia e variˆancia de luminosidade, podem assumir comportamentos similares ao longo de transi¸c˜oes entre tomadas, movimenta¸c˜ao de objetos, opera¸c˜oes de cˆamera ou varia¸c˜ao de luz, entre outras, o que dificulta a caracteriza¸c˜ao correta de cada um desses eventos.
A combina¸c˜ao dessas v´arias caracter´ısticas na constru¸c˜ao de um delimitador de tomadas pode levar a melhores resultados. Combinar caracter´ısticas oriundas de dom´ınios diferentes, como histogramas (dom´ınio de cor) e varia¸c˜ao entre pixels (dom´ınio espacial) pode ser uma forma de compensar suas deficiˆencias individuais.
Trabalhos recentes como os de Vasconcelos e Lippman [VL00] e Hanjalic [Han02] apontam na dire¸c˜ao de classificadores bayesianos que utilizam n˜ao s´o as distribui¸c˜oes da varia¸c˜ao do conte´udo visual em tomadas e entre tomadas como tamb´em probabilidades computadas com base na dura¸c˜ao das tomadas. Tais classificadores podem se mostrar alternativas mais robustas aos in´umeros eventos presentes no decorrer do v´ıdeo e que s˜ao fontes de falsos positivos e falsos negativos.
O estudo de solu¸c˜oes bayesianas (e outras abordagens probabil´ısticas), a composi¸c˜ao de caracter´ısticas de baixo-n´ıvel em descritores com maior poder de classifica¸c˜ao e t´ecnicas baseadas em aglomerados1 s˜ao os pr´oximos passos para a continua¸c˜ao deste estudo, bem como a aplica¸c˜ao da delimita¸c˜ao de tomadas em novas ferramentas para navega¸c˜ao de explora¸c˜ao de v´ıdeo digital.
1Do originalclustering.
Referˆ encias Bibliogr´ aficas
[AL96] Gulrukh Ahanger and Thomas D. C. Little. A survey of technologies for parsing and indexing digital video. Journal of Visual Communication and Image Repre-sentation, 7(1):28–43, Mar¸co 1996.
[Ala93] Adnan M. Alattar. Detecting and compressing dissolve regions in video sequences with a dvi multimedia image compression algorithm. Proceedings of IEEE Inter-national Symposium on Circuits and Systems (ISCAS), 1:13–16, Maio 1993. 20, 41
[BB82] D. .H Ballard and C. M. Brown. Computer Vision. Prentice-Hall, New Jersey, NY, 1982. 28
[BB95] S. S. Beauchemin and J. L. Barron. The computation of optical flow. ACM Computing Surveys, 27(3), Setembro 1995. 29
[BDBP02] Marco Bertini, Alberto Del Bimbo, and Pietro Pala. Indexing for reuse of tv news shots. Pattern Recognition, 35:581–591, Mar¸co 2002. 1
[BDF+99] P. Bouthemy, Y. Dufournaud, R. Fablet, R. Mohr, S. Peleg, and A. Zomet.
Content-based browsing and navigation. InEuropean Workshop on Content-Based Multimedia Indexing CBMI’99, Toulouse, France, Outubro 1999. 6
77
78 REFER ˆENCIAS BIBLIOGR ´AFICAS [BR96] J. S. Boreczky and L. Rowe. Comparison of video shot boundary detection tech-niques. In Proc. IS&T/SPIE Storage and Retrieval for Still Image and Video Databases IV, volume 2670, pages 170–179, Fevereiro 1996. 25, 46
[Can86] John Canny. A computational approach to edge detection. IEEE Transactions on Pattern Analysis and Machine Inteligence, 8(6):679–698, 1986. 29
[CC01] Luciano da Fontoura Costa and Roberto Marcondes Cesar, Jr. Shape Analysis and Classification: Theory and Practice. CRC, 1 edition, 2001.
[CHH+00] Shih-Fu Chang, Qian Huang, Thomas Huang, Atul Puri, and Behzad Shahraray.
Multimedia search and retrieval. In Atul Puri and Tsuhan Chen, editors,Advances in Multimedia: Systems, Standards and Networks. Marcel Dekker, New York, 2000.
1
[DSP91] Glorianna Davenport, Thomas Aguierre Smith, and Natalio Pincever. Cinematic primitives for multimedia. IEEE Computer Graphics and Applications, 11:67–74, Julho 1991. 3, 4
[Eco02] Umberto Eco. Como se Faz uma Tese. Perspectiva, 17 edition, 2002.
[FT98] A. M¨ufit Ferman and A. Murat Tekalp. Efficient filtering and clustering methods for temporal video segmentation and visual summarization. Journal of Visual Communication and Image Representation, 9(4):336–351, Dezembro 1998. 8, 44, 55
[GCAL03] Silvio Jamil Ferzoli Guimar˜aes, Michel Couprie, Arnaldo de Albuquerque Ara´ujo, and Neucimar Jerˆonimo Leite. Video segmantation based on 2d image analysis.
Pattern Recognition Letters, 24:947–957, 2003. 20
REFER ˆENCIAS BIBLIOGR ´AFICAS 79 [GKS00] Ullas Gargi, Rangachar Kasturi, and Susan H. Strayer. Performance characteriza-tion of video-shot-change deteccharacteriza-tion methods. IEEE Transactions on Circuits and Systems for Video Technology, 10(1):1–13, 2000. 25, 27, 31,37, 46, 75
[GW00] Rafael C. Gonzalez and Richard E. Woods. Processamento de Imagens Digitais.
Edgard Bl?cher, 1 edition, 2000. 29, 30, 44, 46
[Han02] Alan Hanjalic. Shot-boundary detection: Unraveled and resolved? IEEE Transac-tions on Circuits and Systems for Video Technology, 12(2):90–105, fevereiro 2002.
v, 3,4, 6,8, 16, 19,20, 31, 51,52, 76
[HO00] Kien A. Hua and JungHwan Oh. Detecting video shot boundaries up to 16 times faster (poster session). InProceedings of the eighth ACM international conference on Multimedia, pages 385–387. ACM Press, 2000.
[HWJ94] A Hampapur, T. Weymouth, and R. Jain. Digital video segmentation. In Proceed-ings of the second ACM international conference on Multimedia, pages 357–364.
ACM Press, 1994. 13
[IP97] F Idris and S. Panchanathan. Review of image and video indexing techniques.
Journal of Visual Communication and Image Representation, 8(2):146–166, Junho 1997. 25, 26
[IR98] ITU-R. Recommendation bt.470-6. Technical report, International Telecommuni-cation Union, Novembro 1998. 30
[KC01] Irena Koprinska and Sergio Carrato. Temporal video segmentation: A survey.
Signal Processing: Image Communication, 16(5):477–500, Junho 2001. 25
80 REFER ˆENCIAS BIBLIOGR ´AFICAS [KJ91] R. Kasturi and R. Jain. Computer Vision: Principles, chapter Dynamic Vision,
pages 469–480. IEEE Computer Society Press, Washington, DC, 1991. 27 [LdW02] Longin Jan Latecki and Daniel de Wildt. Automatic recognition of unpredictable
events in videos. In International Conference on Pattern Recognition, Qu?bec, Agosto 2002.
[Lie99] Rainer Lienhart. Comparison of automatic shot boundary detection algorithms.
In Proc. IS&T/SPIE Storage and Retrieval for Image and Video Databases VII, volume 3656, pages 290–301, 1999. 25
[Lie01] Rainer Lienhart. Reliable transition detection in videos: A survey and practi-tioner’s guide. International Journal of Image and Graphics, 1(3):469–486, 2001.
25
[LPE97] Rainer Lienhart, Silvia Pfeiffer, and Wolfgang Effelsberg. Video abstracting. Com-munications of ACM, 40(12):54–62, 1997. v, 3, 4
[MPEG02] MPEG Moving Picture Experts Group. Mpeg-4 overview - (v.21 - jeju version).
Technical report, International Oorganisation for Standardisation, Mar?o 2002. 2 [MPEG03] MPEG Moving Picture Experts Group. Mpeg-7 overview (version 9). Technical
report, International Organisation for Standardisation, Mar?o 2003. 2
[NT92] Akio Nagasaka and Yuzuru Tanaka. Automatic video indexing and full-video search for object appearances (abstract). J. Inf. Process., 15(2):316, 1992. 26, 30 [Pro] The Open Video Project. http://www.open-video.org. v, 5, 12, 17
REFER ˆENCIAS BIBLIOGR ´AFICAS 81 [SFSP01] Chang Shih-Fu, Thomas Sikora, and Atul Puri. Overview of mpeg-7 standard.
IEEE Transactions on Circuits and Systems for Video Technology, 11(6):685–687, Junho 2001.
[Sha95] B. Shahraray. Scene change detection and content-based sampling of video se-quences. In Proceedings of IS&T/SPIE, volume 2419, pages 2–13, 1995. 27 [SLG02] Philippe Salembier, Joan Llach, and Luis Garrido. Visual segmentation tree
cre-ation for mpeg-7 description schemes. Pattern Recognition, 35:563–579, Mar¸co 2002.
[SLS03] Nicu Sebe, Michael S. Lew, and Arnold W. M. Smeulders. Video retrieval and sum-marization: editorial introduction. Computer Vision and Image Understanding, 92(2-3):141–146, Novembro-Dezembro 2003. 4
[TDV00] Ba Tu Truong, Chitra Dorai, and Svetha Venkatesh. New enhancements to cut, fade, and dissolve detection processes in video segmentation. InProceedings of the eighth ACM international conference on Multimedia, pages 219–227. ACM Press, 2000. 42, 52, 55
[UFGB99] Shingo Uchihashi, Jonathan Foote, Andreas Girgensohn, and John Boreczky.
Video manga: Generating semantically meaningful video summaries. In ACM Multimedia 99, Orlando, Florida, Outubro 1999.
[VL97] Nuno Vasconcelos and Andrew Lippman. A bayesian video modeling framework for shot segmentation and content characterization. In Proceedings of the 1997 Workshop on Content-Based Access of Image and Video Libraries (CBAIVL ’97), page 59. IEEE Computer Society, 1997. 20
82 REFER ˆENCIAS BIBLIOGR ´AFICAS [VL00] Nuno Vasconcelos and Andrew Lippman. Statistical models of video structure for content analyis and characterization. IEEE Transactions on Image Processing, 9(1):3–19, Janeiro 2000. 20,76
[XL98] Wei Xiong and John Chung-Mong Lee. Efficient scene change detection and camera motion annotation for video classification. Computer Vision and Image Under-standing, 71(2):166–181, Agosto 1998. vi,37, 39, 40
[XLI95] Wei Xiong, John Chung-Mong Lee, and Man-Ching Ip. Net comparison:a fast and effective method for classifying image sequences. InProc.of SPIE Conference on Storage and Retrieval for Image and Video Databases III, volume 2420, pages 318–328, San Jose, CA, 1995. 27, 28
[YL95] Boon-Lock Yeo and Bede Liu. Rapid scene analysis on compressed video. IEEE Transactions on Circuits and Systems for Video Technology, 5:533–544, Dezembro 1995. 19, 32, 34,36, 52
[ZCPR03] W. Zhao, R Chellappa, P. J. Phillips, and A. Rosenfeld. Face recognition: A literature survey. ACM Computing Surveys, 35(4):399–458, 2003. 6
[ZKS93] HongJiang Zhang, Atreyi Kankanhalli, and Stephen W. Smoliar. Automatic par-titioning of full-motion video. Multimedia Systems, 1(1):10–28, 1993. vi, 8, 26, 27, 30,31, 32, 51,60, 65, 75
[ZMM95] Ramin Zabih, Justin Miller, and Kevin Mai. A feature-based algorithm for de-tecting and classifying scene breaks. Proceedings of ACM Mutlimedia 95, pages 189–200, Novembro 1995. 28